Estimasi Satu Populasi: Menggunakan Sebaran Student-T
Pendugaan parameter rata-rata untuk satu populasi melalui estimasi titik dan estimasi interval telah dibahas dalam artikel sebelumnya. Namun, pada kondisi dimana standar deviasi populasi tidak diketahui, kita perlu menggunakan sampel standar deviasi s sebagai gantinya. Hal ini akan menambah ketidakpastian karena s adalah variabel yang dapat berbeda dari sampel ke sampel. Oleh karena itu, distribusi normal tidak dapat digunakan pada kondisi ini dan kita harus menggunakan distribusi-t.
Outline Artikel
Sebaran T-Student / Distribusi Student-T
Dalam distribusi-t, kita menggunakan
sampel standar deviasi s sebagai pengganti standar deviasi populasi σ. Namun, karena s adalah variabel
sampel, maka akan ada ketidakpastian yang lebih besar dalam estimasi interval.
Oleh karena itu, semakin besar sampel yang kita gunakan, semakin sedikit
ketidakpastian yang terjadi dalam estimasi interval.
Asumsi yang Harus Dipenuhi
Untuk menggunakan distribusi-t, kita harus memastikan bahwa asumsi yang dibutuhkan telah terpenuhi.
- Pertama, standar deviasi populasi harus tidak diketahui.
- Kedua, populasi harus berdistribusi normal.
- Ketiga Jika populasi tidak berdistribusi normal, kita dapat menggunakan sampel besar (biasanya lebih dari 30) untuk memenuhi asumsi normalitas.
Menghitung Confidence Interval
Setelah memastikan asumsi terpenuhi,
kita dapat menggunakan distribusi-t untuk menghitung estimasi interval. Untuk
menghitungnya, kita perlu menentukan derajat kebebasan (degrees of freedom) terlebih
dahulu. Derajat kebebasan adalah jumlah pengamatan dalam sampel dikurangi satu.
Kemudian, kita dapat menggunakan tabel distribusi-t (dibawah) untuk mencari
nilai t untuk derajat kebebasan dan tingkat signifikansi tertentu. Dengan
menggunakan nilai t tersebut, kita dapat menghitung estimasi interval untuk
rata-rata populasi.
Tabel distribusi-t dengan α 1%, 5%, dan 10%
Derajat Kebebasan |
Tingkat Signifikansi |
||
10% |
5% |
1% |
|
1 |
1.29 |
6.31 |
31.82 |
2 |
1.14 |
2.92 |
6.96 |
3 |
1.04 |
2.35 |
4.54 |
4 |
0.98 |
2.13 |
3.75 |
5 |
0.94 |
2.02 |
3.36 |
6 |
0.92 |
1.94 |
3.14 |
7 |
0.90 |
1.89 |
2.98 |
8 |
0.87 |
1.86 |
2.84 |
9 |
0.86 |
1.83 |
2.73 |
10 |
0.85 |
1.81 |
2.64 |
11 |
0.84 |
1.80 |
2.58 |
12 |
0.83 |
1.78 |
2.53 |
13 |
0.83 |
1.77 |
2.49 |
14 |
0.82 |
1.76 |
2.45 |
15 |
0.82 |
1.75 |
2.43 |
16 |
0.81 |
1.75 |
2.41 |
17 |
0.81 |
1.74 |
2.39 |
18 |
0.80 |
1.73 |
2.37 |
19 |
0.80 |
1.73 |
2.36 |
20 |
0.80 |
1.72 |
2.34 |
21 |
0.79 |
1.72 |
2.33 |
22 |
0.79 |
1.71 |
2.32 |
23 |
0.79 |
1.71 |
2.31 |
24 |
0.78 |
1.71 |
2.30 |
25 |
0.78 |
1.70 |
2.29 |
26 |
0.78 |
1.70 |
2.29 |
27 |
0.78 |
1.69 |
2.28 |
28 |
0.77 |
1.69 |
2.27 |
29 |
0.77 |
1.69 |
2.27 |
30 |
0.77 |
1.68 |
2.26 |
Dalam distribusi-t, Confidence Interval
(CI) digunakan untuk memberikan rentang kemungkinan untuk nilai parameter
rata-rata populasi yang sebenarnya. CI adalah rentang yang diberikan pada
tingkat kepercayaan tertentu dimana nilai parameter sebenarnya diharapkan jatuh
di dalamnya.
Rumus untuk menghitung CI pada
distribusi-t adalah sebagai berikut:
CI = x̄ ± tα/2 * (s/√n)
Dimana:
- x̄ adalah
estimasi titik rata-rata sampel
- tα/2
adalah nilai kritis dari distribusi-t pada tingkat signifikansi α/2
dengan derajat kebebasan (df) = n-1
- s adalah standar
deviasi sampel
- n adalah ukuran
sampel
Dalam praktiknya, untuk menghitung CI,
kita perlu menentukan nilai tingkat kepercayaan (1-α) dan ukuran sampel (n), dan kemudian
mencari nilai kritis tα/2 pada tabel distribusi-t.
Distribusi-t Perkiraan untuk Sampel Besar
Jika standar
deviasi populasi tidak diketahui, kita dapat menggunakan sampel standar deviasi
s sebagai gantinya. Hal ini akan menambah ketidakpastian karena s adalah
variabel dari sampel ke sampel, sehingga kita harus menggunakan distribusi-t
sebagai alternatif distribusi normal.
Namun, ada kasus
di mana kita dapat menggunakan distribusi normal bahkan jika standar deviasi
populasi tidak diketahui. Jika ukuran sampel cukup besar (biasanya lebih dari
30), maka kita dapat mengasumsikan bahwa distribusi sampel akan mendekati
distribusi normal berkat Central Limit Theorem (CLT). Oleh karena itu, kita
dapat menggunakan distribusi normal untuk menghitung interval kepercayaan atau
menguji hipotesis tentang rata-rata populasi jika ukuran sampel lebih besar
dari 30 dan kita tidak mengetahui standar deviasi populasi.
Namun, perlu
diingat bahwa asumsi ini tidak berarti bahwa populasi asli pasti normal jika
ukuran sampel lebih dari 30. Sebelum menggunakan distribusi normal, sebaiknya
dilakukan pengujian normalitas terlebih dahulu untuk memastikan apakah populasi
berdistribusi normal atau tidak.
Contoh
Kasus
Sebagai contoh, jika kita ingin
mengestimasi rata-rata berat badan mahasiswa di sebuah perguruan tinggi dengan
tingkat kepercayaan 95% dan ukuran sampel 50, kita dapat menghitung CI
menggunakan rumus di atas. Jika estimasi titik rata-rata sampel adalah 65kg dan
standar deviasi sampel adalah 5kg, maka kita dapat mencari nilai kritis tα/2 pada tabel distribusi-t dengan df =
49 dan tingkat signifikansi 0.025 (dibagi dua karena tingkat kepercayaan 95%).
Dalam contoh ini, tα/2 = 2.009.
Solusi
Maka, CI yang diberikan adalah:
CI = 65 ± 2.009 * (5/√50)
CI = 65 ± 1.42
CI = (63.58, 66.42)
Artinya, dengan tingkat kepercayaan
95%, kita dapat yakin bahwa rata-rata berat badan mahasiswa di perguruan tinggi
tersebut berada dalam rentang 63.58kg hingga 66.42kg.
Namun, perlu diingat bahwa CI hanya
memberikan estimasi dan rentang kemungkinan untuk nilai parameter sebenarnya.
Oleh karena itu, penting untuk mempertimbangkan faktor-faktor lain seperti
ukuran sampel, kepercayaan data, dan asumsi distribusi untuk membuat keputusan
yang tepat dan akurat.
Kesimpulan
Dalam kesimpulannya, jika kita tidak mengetahui nilai standar deviasi populasi, kita dapat menggunakan sampel standar deviasi s dan distribusi-t untuk melakukan estimasi interval. Namun, kita harus memastikan bahwa asumsi standar deviasi populasi tidak diketahui dan populasi berdistribusi normal telah terpenuhi. Semakin besar sampel yang digunakan, semakin sedikit ketidakpastian yang terjadi dalam estimasi interval.
Posting Komentar untuk "Estimasi Satu Populasi: Menggunakan Sebaran Student-T"