Meluruskan Tentang Interval Konfidensi

Suatu ketika saya sedang giat-giatnya belajar statistik. Di tengah pembelajaran, saya menemukan sebuah paper (artikel?) yang salah satu poinnya mengatakan kurang lebih seperti ini :

“Interval konfidensi (IC) 95% secara rata-rata mampu menangkap 85% data real/aktual/populasi (bukan sampel*).”

*Harap selalu bedakan populasi dan sampel.

Dahi saya tiba-tiba mengerenyit dan sejenak bertanya,

“Bukankah justru IC 95% itu menangkap 95% data populasi ya?”,

Karena waktu kuliah saya diajarkan demikian. Atau bisa jadi saya yang salah paham.

Saya coba bertanya pada beberapa teman statistik. Ternyata teman-teman saya justru setuju dengan saya bahwa IC 95% menangkap 95% data aktual. Tapi saya tetap ragu dan saya lanjut belajar.

Luckily, tidak lama kemudian, saya menemukan video dan tulisan yang menjelaskan IC. Definisi dari IC berdasarkan sumber tersebut kurang lebih seperti ini :

“Jika kita mengambil sampel sejumlah N data kemudian menghitung interval konfidensinya (misal 95%) sebut saja X, maka X tersebut dapat menangkap mean daripada 95% sampel yang akan datang, dengan syarat dalam jangka waktu yang panjang, atau pengambilan sampel berulang-ulang setelah X dilakukan.”

Bingung? Oke, mari saya coba jelaskan lagi. Agar lebih mudah kita gunakan contoh :

Kita ditugaskan untuk menghitung rata-rata berat penduduk Indonesia. Dikarenakan kita tidak punya datanya, dan mengumpulkan berat 200 juta orang itu sulit, maka kita mengambil sampel, sebut saja 100 orang. Dari 100 orang yang kita hitung, rata-rata beratnya ternyata (misalkan) 60 kg. Kemudian kita hitung interval konfidensinya, hasilnya adalah (misalkan) antara 50 kg – 70 kg (IC1).

Kemudian kita ambil sampel lagi 100 orang. Hasilnya misal mean2 = 65, dengan IC2 55 kg – 75 kg.

Kemudian kita ambil sampel lagi 100 orang. Hasilnya mean3 = 55, dengan IC3 45  kg – 65 kg.

Kemudian kita ulangi langkah di atas, mengambil sampel-hitung mean-hitung IC, sebut saja kita ulangi sampai 1000 kali, maka 95% MEAN 1000 sampel yang diulangi tersebut akan jatuh di IC yang kita ambil pertama kali yaitu IC1. seperti contoh di atas, mean2 dan mean3 jatuh di IC1.

Masih belum jelas?

Kalau belum jelas, saya menemukan visualisasi untuk simulasi inteval konfidensi :

http://rpsychologist.com/d3/CI/

ic_1

Gambar di atas merupakan contoh simulasi penghitungan IC.  Garis putus-putus merah merupakan mean daripada populasi. Kemudian garis horizontal hitam merupakan IC, dan tiap garis memiliki bulatan biru. Bulatan tersebut merupakan mean daripada sampel. Adapun garis horizontal merah merupakan sampel yang meannya tidak jatuh dalam IC.  Masing-masing IC akan coba menangkap mean sampel di atasnya atau setelahnya. Coba diubah-ubah “Sample size”-nya. Misalkan coba dari 10, 100, kemudian 10000. Apa yang terjadi? Ya, panjang garis hitam horizontal menjadi lebih pendek, yang artinya range IC semakin mengecil. Ini disebabkan semakin besar sampel maka error yang muncul pada sampel semakin kecil. Mean sampel juga akan semakin mendekati mean populasi.

ic_2

Disimulasi di atas juga ada bagian yang mencatat sudah berapa sampel yang terkumpul. Dari gambar di atas, telah dilakukan 535 sampling, dimana mean 511 sampel jatuh di interfal konfidensi, dan 24 tidak.

Untuk lebih jelasnya, silahkan dicoba-coba lagi simulasinya. Jangan lupa dibaca penjelasan dibawahnya.

Bagaimana? Sudah paham?

Kalau ada tambahan, kritik, saran, pertanyaan, perjodohan, atau usulan, dipersilahkan diungkapkan 🙂

Semoga bermanfaat.

 

 

 

 

Leave a comment