PENTINGNYA SAMPLING DALAM PENELITIAN

Knowledge & Research

By: Ir. Togar A. Napitupulu, MS., MSc., Ph.D

PDF EQUATION TERFORMAT On sampling and Sampling Techniques

Populasi

Setiap penelitian, selalu mengenai kumpulan object, i.e., orang, perusahaan, benda, dll., yang menjadi pokok perhatian peneliti. Kumpulan objek ini disebut populasi. Bisa dikatakan, ini adalah merupakan ruang lingkup dari penelitian itu sendiri dimana tentang populasi inilah kesimpulan hendak ditarik oleh peneliti.

TELADAN:

Peneliti ingin mengetahui kinerja dari Usaha kecil menengah di Indonesia yang mempraktekkan perencanaan strategis. Untuk kasus ini, populasinya adalah semua usaha kecil menengah yang mempraktekkan perencanaan strategis.
Pelanggan suatu rumah sakit sedang dipelajari berkaitan dengan persepsi mereka terhadap rumahsakit tersebut. Populasi dalam hal ini adalah semua pelanggan dari rumah sakit tersebut. Bukan rumah sakit tersebut.

Karena penelitian selalu mengenai populasi, atau untuk menarik suatu kesimpulan mengenai populasi, maka semua elemen (catatan: pada umumnya anggota dari populasi disebut elemen) dari populasi itu harus diukur (atau diinterview).

TELADAN:

` Misalkan bahwa populasi dari usaha kecil menengah (UKM) di Indonesia yang mempraktekkan perencanaan strategis hanya terdiri dari 10 perusahaan saja. Peneliti ingin menguji klaim : “bahwa apabila perusahaan mempraktekkan perencanaan strategis maka keuntungan perusahaan akan meningkat dengan rata-rata peningkatan diatas 10 Milliyar rupiah”. Secara statistic hipotesis tersebut dirumuskan sebagai berikut:

H₀ : β = 10

H₁ : β > 10

Di mana β adalah rata-rata peningkatan keuntungan (catatan: parameter populasi dalam statistika selalu menggunakan huruf Yunani). Misalkan X adalah peubah acak yang mewakili peningkatan keuntungan. Karena besarnya populasi hanya 10 perusahaan, dan penelitian sejatinya adalah mengenai populasi, maka peneliti memutuskan untuk mengumpulkan semua data, x_i , dari populasi tersebut, yaitu semua perusahaan, e.g., x₁ = 9.8; x₂ = 10.5; x₃ = 9.6; x₄ = 11; x₅ = 12; x₆ = 13; x₇ = 9; x₈ = 12; x₉ = 11; x₁₀ = 10. Kemudian peneliti lalu menghitung rata-rata peningkatan keuntungan sebagai berikut:

β = (∑_(i=1)^(i=10)▒x_i )/10 = (9.8+10.5+9.6+11+12+13+9+12+11+10)/10 = 10.79

Karena β = 10.79 lebih besar dari 10, maka hipotesis H₀ ditolak dan hipotesis H₁ diterima, yang artinya bahwa klaim, yaitu keuntungan meningkat dengan rata-rata peningkata diatas 10 M adalah didukung penelitian ini.

Sample and Sample size

Contoh dan Besarnya Contoh

Ada banyak kasus dimana mengumpulkan data dari populasi sangat mahal, bahkan bisa saja tidak mungkin sama sekali. Sebagai contoh, misalkan kita ingin mengecek apakah klaim oleh perusahaan peralatan-peralatan yang memproduksi mesin pengisian botol yang mampu mengisi 1.5 liter tiap botol coca cola. Populasi untuk studi seperti ini tentu semua botol coke yang diproduksi sekarang dan dimasa yang akan datang. Oleh karena produksi coke di masa datang belum dihasilkan, maka tidak ada cara untuk mengetahui populasi yang pasti untuk kasus ini.

Manakala kita tidak mampu mengukur semua elemen dari populasi, kita masih bisa membuat kesimpulan tentang populasi, i.e., dengan mengambil dan mengukur hanya sebagian dari populasi tersebut, yang disebut sample, yaitu sub-set dari populasi. Statistik yang dihasilkan dari sample disebut penduga, yaitu penduga dari parameter populasi tersebut.

EXAMPLE #3:

TELADAN #3:

Pada TELADAN #2, parameter populasi adalah rata-rata kenaikan untung dari populasi. Misalkan kita mengambil sample (contoh) sebanyak 4 dari 10 elemen populasi SME tersebut (Latihan: coba hitung berapa banyak contoh berukuran 4 yang bisa dibentuk dari 10 elemen populasi tersebut?). Dari salah satu contoh, anda dapat menghitung rata-rata contoh, biasanya diberi notasi (beta topi) untuk menyatakan penduga. Apakah masih bisa kita hasilkan kesimpulan tentang populasi dari contoh yang hanya 4 unit ini? Jawabannya adalah Ya; sudah barang tentu dengan tingkat kesalahan tertentu, atau dengan tingkat kepercayaan sebesar (1 – α), dimana α adalah tingkat nyata, yaitu, bahwa kita hanya dapat percaya, atau hanya dapat mengandalkan hasil uji hipotesis tersebut sebesar 95% misalnya. Tingkat nyata sebesar 5 % adalah besarnya error yang diizinkan sebagai akibat berbuat kesalahan, yaitu, menolak hopotesis nol (H₀) yang benar. Besarnya α ini tergantung pada anda, peneliti. Sebagai contoh, bila anda bersedia menetapkan tingkat nyata sebesar 5 %, i.e., error yang diizinkan sebesar 5 %, maka tingkat kepercayaan terhadap hasil uji nantinya adalah sebesar (1 – 5 %), yaitu 95 %.

Dari TELADAN #3, dapat dilihat bahwa ada resiko dalam bentuk error sebagai akibat membuat kesimpulan dari hanya sebagian dari populasi – atau contoh. Besarnya error ini, yaitu sampling error, tergantung pada besarnya contoh (n). Makin besar ukuran contoh, maka konsekuensi errornya mekin kecil. Dalam modul ini logikanya akan kita balik dengan lebih dulu menentukan besarnya error yang bersedia kita terima, lalu berdasarkan besar error yang besedia kita terima tersebut, lalu kita tentukan besarnya contoh. Hal kedua yang perlu kita putuskan sebelum menentukan besarnya contoh adalah tingkat ketelitian yang kita mau dari penduga. Dalam teori penarikan contoh, ini disebut margin of error (e),yang pada prisnsipnya merupakan ukuran tingkat ketelitian dari penduga kita, i.e., besarnya interval ± e di mana kita menghendaki nilai parameter β dari populasi (yang kita tidak tahu) berada di dalamnya. Oleh karena itu hal kedua yang perlu kita tentukan dalam menentukan besarnya contoh adalah tingkat ketelitian yang kita inginkan yaitu besarnya margin of error (e)nya (catatan: e tidak sama dengan α, atau tingkat nyata).

Kembali kepada error yang pertama yang harus dipertimbangkan dalam menentukan besar contoh, yaitu error yang diizinkan, yang berkaitan dengan tingkat kepercayaan, ia pada dasarnya merupakan peluang bahwa parameter populasi β berada pada selang ± e. Dengan kata lain tingkat kepercayaan dapat ditulis sebagai berikut :

Probability ( β ̂ – e < β < β ̂ + e ) = 1 – α ………………………………. (1)

Bila X adalah peubah acak dengan nilai tengah (rata-rata) populasi β, dan mengikuti distribusi normal dengan simpangan baku σ, i.e., yang dalam notasi statistika sebagai berikut,

X ~ N (β, σ2 )
β ̂ ~ N(β, σ^2/n)

Dengan informasi di atas tentang β ̂, maka stastik berikut,

z= (β ̂ ̂-β )/(σ/√n) ……………………………………………………… (1c)

Mengikuti distribusi normal.

Dari persamaan (1c) maka persamaan (1) dapat ditulis kembali sebagai berikut (coba turunkan sendiri rumus ini),

Probability ( β ̂ – Z_(α/2) σ/√n< β < β ̂ + Z_(α/2) σ/√n ) = 1 – α ………………………………. (2)

Dimana z_(α/2) adalah nilai peubah normal baku dari distribusi normal baku, dimana Peluang (z > z_(α/2))= α/2.
Dari persamaan (1) dan (2) kemudian diturunkan persamaan berikut,
e = Z_(α/2) σ/√n ………………………………………………………………………………. (3)
By simplifying equation (3) we get the sample size,

Degan menyederhanakan persamaan (3) selanjutnya kita dapat rumus besarnya contoh sebagai berikut,
n = (Z_(α/2)^2 σ^2)/e^2 …………………………………………………………………………….. (4)
Sebagai kesimpulan, untuk menentukan besarnya contoh, n, perlu ditentukan terlebih dahulu (1) tingkat nyata (α) atau tinkat kepercayaan (1- α), (2) error margin atau tingkat ketelitian, e,dan (3) ragam dari peubah acak X, yaitu σ2. Perhatikan, besarnya contoh tidak tergantung pada besarnya populasi (N).

TELADAN # 4: Penentuan besarnya contoh untuk menduga Rata-rata

Kita hendak menduga gaji rata-rata guru Sekolah Menengah Atas di Jakarta Timur dengan tingkat kepercayaan 95 %, dan dengan tingkat ketelitian plus-minus Rp 100.000,-. Dalam hal ini kita tidak mengetahui sama sekali besarnya simpangan baku (σ), karena sama sekali survey belum dilakukan untuk menduga nilai dari σ. Dalam keadaan seperti ini kita terpaksa harus menduga nilai σ yang terbaik, bisa saja dari studi terdahulu atau dugaan dari situasi yang mirip di tempat lain, dan katakanlah sebesar Rp. 1000.000.-. Oleh karena itu, dalam situasi dimana tidak ada informasi yang lebih baik lagi, mari kita gunakan itu sebagai pengganti dari σ.

Dari nilai tingkat kepercayaan 95 %, kita bisa dapatkan nilai z = 1.96 (lihat Tabel Z). Oleh karena itu, persamaan (4) menjadi :

n = (((1.96)(1000000))/100000)^2 = 384.16

atau sebesar 384 guru, dengan membulatkan ke atas. (Catatan: persamaan (4) sebenarnya harus menggunakan distribusi student-t – oleh karenanya menggunakan Tabel t; akan tetapi, untuk contoh, n, yang cukup besar, yaitu > 30, student-t dapat didekati oleh sebaran normal baku – sebaran Z).

LATIHAN: Coba ubah tingkat ketelitian pada TELADAN #4 dari Rp. 100.000 menjadi Rp 500.000. Hitunglah besarnya contoh. Apa komentar anda dari hasil tersebut?

Sering terjadi dimana nilai dari peubah yang ingin kita duga bukan rata-rata populasi, tapi proporsi dari populasi (p),e.g., proporsi dari Binusian yang mendukung lifestyle gay misalnya. Dalam kasus seperti ini, rumus (4) tetap sama kecuali ragam (σ2) harus diganti dengan ragam dari proporsi, yaitu p(1-p). Lagi-lagi, dalam penentuan nilai dari proporsi, p, tetap menjadi masalah. Seperti biasanya, kita sering sekali jadinya menggunakan nilai proporsi dari penelitian sebelumnya atau yang mirip. Perhatikan tapinya, ragam dari proporsi akan maksimum pada saat proporsi p = 0.5 (50 %). Oleh karena itu perhitungan besarnya contoh dengan menggunakan p = 0.5 selalu memberikan besar contoh yang lebih besar dari yang dibutuhkan; oleh sebab itu, mengunakan nilai ini akan selalu aman.

TELADAN #5: Besar contoh untuk menduga proporsi

Seorang professor di Departemen sosiologi di Universitas Binus hendak menduga proporsi mahasiswa yang mendukung gaya hidup gay di Binus. Berapa besar contoh yang dibutuhkan?

Seperti biasa, pertama dia perlu mentukan margin of error, katakanlah 0.05 (5 %). Kedua, dia juga perlu menentukan tingkat kepercayaan dari dugaan itu nantinya, katakanlah 95 % (atau tingkat nyatanya adalah 5 %), sehingga z = 1.96. Kemudian dia juga memutuskan menggunakan keragaman dari proporsi yang maksimum, yaitu p = 0.5. Sekarang dengan menggunakan formula yang telah dimodifikasi, dengan mengubah ragam menjadi p(1-p), maka berdasarkan rumus (4) kita dapatkan :

n = (Z_(α/2)^2 (p(1-p)))/e^2 = (〖1.96〗^2 (0.5(1-0.5)))/〖0.05〗^2 = 384.16

atau, besarnya contoh adalah 384, yaitu dengan membulatkan ke bilangan bulat terdekat.

LATIHAN:

(1) Coba ubah tingkat ketelitian atau margin error dari 0.05 (5 %) ke 0.025 (2.5 %). Hitunglah kembali berapa besarnya contoh? Berikan komentar tentang hasil tersebut.

(2) Coba ubah proporsi p, dari 0.5 menjadi 0.2, dengan tingkat ketelitian yang sama pada tingkat 0.05 (5%). Berapa besar contoh yang baru? Berikan juga komentar tehadap hasil ini.

Dari dua teladan yang didiskusikan di atas dapat dilihat bahwa bila variable yang menjadi pokok perhatian kita adalah mengukur proporsi, maka dengan memilih p = 0.5 akan selalu memberikan besar contoh yang konservatif, yaitu, akan selalu memberikan besar contoh yang aman dan juga tidak akan memberikan besar contoh yang jauh melebihi besar contoh yang dihitung bila proporsi populasi diketahui. Akan tetapi, bila variable yang menjadi pokok perhatian kita adalah rata-rata populasi (bukan proporsi), sekalipun penduga dari ragam (σ²) dari penelitian terdahulu diketahui, kita masih menghadapi masalah, karena pada setiap studi, kita akan selalu berhadapan dengan banyak variable yang menjadi pokok perhatian kita, dan hampir pasti ragam dari masing-masing variable ini pun akan berbeda satu sama lain. Akan tetapi dalam situasi dimana banyak variable, kita bisa mengasumsikan seolah-olah ada variable proporsi diantara variable tersebut, sekalipun pada prinsipnya tidak dibutuhkan. Bahwa dengan menggunaka rumus besarnya contoh untuk kasus proporsi dengan menggunakan p = 0.5 akan selalu memberikan besar contoh yang selalu aman atau konsevatif, termasuk dibandingkan dengan besar contoh untuk kasus yang bukan proporsi (rata-rata populasi), maka dianjurkan untuk selalu menggunakan rumus proporsi dengan p = 0.5. Pembuktian bahwa inilah yang paling konservatif diuraikan di bawah ini.

Hal lain yang perlu mendapat perhatian, pertama, bahwa dalam menurunkan rumus di atas, diasumsikan atau didasarkan atas pengambilan contoh secara acak sederhana (teknik penarikan contoh acak sederhana) dalam memilih contohnya. Perhatian khusus perlu apabila teknik penarikan contoh dilakukan selain dengan cara acak sederhana. Kedua, bahwa formula tersebut bertujuan hanya untuk memastikan bahwa besarnya contoh tersebut cukup untuk mewakili populasi dengan tingkat margin error dan tingkat kepercayaan yang telah ditetapkan. Data analisis tertentu kadang-kadang membutuhkan sejumlah minimum contoh (ulangan atau pengamatan) tertentu. Sebagai aturan umum, kita menggunakan yang terbesar dari kedua persyaratan tersebut. Sebagai contoh, bila besarnya contoh berdasarkan rumus yaitu dalam memenuhi persyaratan perwakilan adalah 350, dan kebutuhan observasi sesuai dengan kebutuhan teknik data analisis memerlukan 200, maka kita harus memilih banyaknya contoh seesar 350. Sebaliknya, bila teknik data analisis menbutuhkan banyaknya observasi sebesar 300 sedangkan besar contoh sessuai rumus (4) adalah 250, maka kita harus mengunakan angka 300 sebagai besarnya contoh.

A Note on Slovin’s Formula
Sebuah Catatan Berkaitan dengan Formula Slovin

Banyak penelitian yang menggunakan rumus Slovin dalam penentuan besarnya contoh dalam penelitian mereka, termasuk thesis atau skripsi di Binus. Sebagian diantaranya menunjukkan pemahaman yang sedikit keliru dengan penggunaan dan pengertian rumus tersebut. Oleh karena itu sangat penting di sini diuraikan dalam kasus atau kondisi seperti apa rumus tersebut bisa digunakan dan pengertian tentang apa yang dimaksud dengan komponen-komponen dari rumus tersebut. Slovin’s formula adalah sebagai berikut:

n = N/(1+ Ne^2 ) ……………………………………………… (5)

Dimana n = besarnya contoh; N = besarnya populasi; dan e adalah margin of error (tingkat ketelitian).

Sebenarnya kata Slovin apa berkaitan dengan nama orang atau nama samaran tidak jelas; bahkan literature di mana Slovin sebagai penulisnya tidak pernah ditemukan di pustaka. Rumus Slovin sendiri pernah diturunkan di literature yaitu dalam Yamane (1967) sekalipun tidak diberi label “Slovin”. Perhatikan, rumus (5) tidak tergantung sama sekali dengan ragam (variance). Oleh karena itu adalah sangat naif kalau kita menentukan besarnya contoh yang sama untuk beberapa populasi dengan besar populasi yang sama (N) namun dengan keragaman yang berbeda. Inilah salah satu kesalahan besar yang akan terjadi bila menggunakan rumus ini.

Kesalahan kedua yang sering terjadi bila menggunakan rumus ini adalah tidak membedakan antara margin of error (e) dan tingkat nyata (α). Misalnya pengguna rumus ini akan sering mengatakan demikian: “ dengan margin of error 5 % atau sama dengan tingkat kepercayaan 95 %……..”. Pada hal bisa saja dengan tingkat kepercayaan 95 % margin of errornya 1 % misalnya, karena dua hal tersebut merupakan dua konsep yang berbeda (lihat penjelasan sebelumnya).

Ketiga, bila seorang peneliti misalnya menggunakan tingkat kepercayaan selain 95 %, misalnya 90 %, dan mengatakan bahwa margin of errornya adalah 10 %, inipun adalah salah, karena rumus Slovin ini hanya berlaku untuk tingkat kepercayaan 95 %. Margin of error bisa berapa saja. Hal ini akan diuraikan melalui penurunan rumus Slovin berikut.

Cochran (1977) menurunkan rumus besarnya contoh untuk kasus variable proporsi (P) dalam keadaan populasi yang terbatas (finite population) adalah sebagai berikut:

n =n_o/(1+ n_o/N) …………………………………………….. (6)

Dimana n = besarnya contoh; N = besarnya populasi; dan

no = (Z_(α/2)^2 (p(1-p)))/e^2 …………………………………………………… (7)

dengan p = 0.5, yaitu proporsi yang memberikan ragam proporsi terbesar; dan dengan tingkat kepercayaan 95 %, sehingga z = 1.96, dibulatkan menjadi 2,maka rumus (7) menjadi

n_o= (2^2 (0.5(1-0.5)))/e^2 = 1/e^2 ……………………………………………….. (8)

Dengan mensubstitusikan persamaan (8) ke persamaan (6) kita dapatkan persamaan berikut:

n= (1⁄e^2 )/(1+(1⁄e^2 )/N)= N/(1+Ne^2 ) ……………………………………………… (9)
Yang merupakan rumus Slovin. Jadi kalau menggunakan rumus Slovin, asumsinya adalah (1) tingkat kepercayaan adalah 95 %; (2) proporsi diasumsikan 50 % (0.5). Margin error bisa berapa saja.

Sampling Technique
Cara Penarikan Contoh

Setelah mendiskusikan bagaimana menentukan besarnya contoh, yaitu penentuan banyaknya subjek dari contoh yang akan diambil dari populasi – element dari contoh disebut subjek -, hal berikutnya yang harus dilakukan dalam penarikan contoh adalah bagaimana subjek nya dipilih atau disebut teknik penarikan contohnya. Ada dua cara memilih subjek, pertama (1) adalah dengan cara probabilistik, dan yang kedua (2) adalah dengan cara non-probabilistik. Teknik probabilistic adalah metode dimana setiap contoh dipilih dengan memastikan bahwa peluang terpilih harus sama. Cara non-probabilistik adalah metode dimana tidak ada cara untuk mengetahui peluang terpilihnya contoh tertentu, apalagi untuk memastikan bahwa semua contoh memiliki peluang yang sama. Apabila pada data analisisnya akan menggunakan statistika inferensial, maka metode penarikan contohnya harus dengan probabilistic. Pada situasi dimana hampir tidak mungkin menggunakan penarikan contoh probabilistic, maka kita harus menjelaskan dan menguraikan cara yang kita tempuh dan menunjukkan sedemikian rupa bahwa cara non-probabilistik yang kita lakukan itu sedapat mungkin telah mendekati metode probabilistic, yaitu, bahwa peluag terpilihnya semua contoh mendekati sama.

Cara penarikan contoh probabilistic yang paling umum adalah dengan teknik penarikan contoh acak sederhana. Dari sebanyak N anggota populasi, kita memilih sebanyak n subjek secara acak. Pertama kita menomeri semua elemen dari populasi dari 1 sampai N. Lalu kita men-generate bilangan acak antara 1 sampai N, biasanya dengan menggunakan fungsi EXCEl : RANDBETWEEN(1, N). Apabila besarnya contoh adalah n, maka kita tinggal memanggil fungsi ini sebanyak n kali, atau dengan meng-copy fungsi itu ke sebanyak n cell yang berbeda. Manakala ada pengulangan angka yang sama, maka fungsi tersebut dipanggil kembali sampai menghasilkan angka yang berbeda dari angka-angka sebelumnya.

TELADAN: Penarikan contoh dengan cara acak sederhana

Coba kita lihat lagi TELADAN #3. Misalkan kita memberikan nomor bagi semua SME dari 1 sampai 10. Dalam istilah teori sampling daftar populasi yang telah dinomori ini disebut sampling frame atau frame saja. Menghasilkan contoh sebanyak 4 subjek, kita bisa memanggil fungsi RANDBETWEEN(1, 10) sebanyak empat kali dan taro di 4 cell pada kolom tertentu. SME yang terpilih adalah empat SME dengan nomer yang terpilih seperti yang tertera pada keempat cell tersebut .

Teknik penarikan contoh probabilistic yang lainnya antara lain : (1) stratified random sampling technique – tehnik ini digunakan manakala populasi dapat dikelompokkan sedemikian rupa dimana masing-masing kelompok lebih homogeny relative disbanding dengan kelompok lainnya; disamping itu, teknik ini dapat digunakan apabila kita tertarik juga untuk membandingkan antar kelompok. (2) Cluster random sampling – tekni ini digunakan manakala framenya tidak tahu atau tidak tersedia; oleh karena itu kita menciptakan clusters yang ada daftarnya atau framenya. Selanjutnya kita memilih cluster dengan acak sederhana dari daftar cluster ini, dan selanjutnya melakukan sensus pada cluster terpilih, atau memilih lagi sample dari cluster terpilih. (3) Systematic sampling – pada teknik ini setiap elemen ke nthdalam populasi dipilh, dimulai dengan elemen yang sebelumnya dipilih secara acak. (4) area sampling – Ini sebenarnya sama dengan cluster sampling yang dibatasi hanya pada area tertentu. (5) double sampling – Pertama kita kumpulkan data awal dari contoh tertentu, lalu kemudian kita pilih sub-sample dari contoh tersebut untuk penyelidikan yang lebih mendalam.
Non-probabilistic sampling antara lain (1) Convenience sampling (pengumpulan data atau informasi dari anggota populasi yang secara lebih convenient menyediakan informasi tersebut)
– Kita survey objek yang gampang dihubungi dan tersedia,
– Digunakan untuk diagnosa secara cepat,
– Sangat sederhana dan murah,
– Keterwakilan populasi sangan lemah (kurang terandalkan).

(2) Purposive Sampling (confined to specific types of people who can provide the desired information) terdiri dari:
• Judgment sampling: experts’ opinion could be sought ,e.g., doctor surveyed for cancer causes.
• Quota sampling: establish quotas for numbers or proportion of people to be sampled, e.g., survey for research on dual career families: 50% working men and 50% working women surveyed.

Untuk lebih detail mengenai hal ini bisa dilihat di Sekaran (2010).