Sabtu, 29 Januari 2011

Statistika Non Parametrik
1. Pendahuluan
Kelebihan Uji Non Parametrik:
- Perhitungan sederhana dan cepat
- Data dapat berupa data kualitatif (Nominal atau Ordinal)
- Distribusi data tidak harus Normal
Kelemahan Uji Non Parametrik:
- Tidak memanfaatkan semua informasi dari sampel (Tidak efisien)
Kelemahan diperbaiki dengan menambah ukuran sampel
Beberapa Uji Non Parametrik yang akan dipelajari :
- Uji tanda berpasangan
- Uji Peringkat 2 Sampel Mann-Whitney
- Uji Peringkat 2 Sampel Wilcoxon
- Uji Korelasi Peringkat Spearman
- Uji Konkordansi Kendall
- Uji Run(s)
2. Uji Tanda Berpasangan
Uji dilakukan pada 2 sampel terpisah (independen)
• tanda (+) → data pada sampel 1 > pasangannya sampel 2
• tanda (–) → data pada sampel 1 < pasangannya sampel 2
• tanda Nol (0) → data pada sampel 1 = pasangannya sampel 2
Tanda Nol tidak digunakan dalam perhitungan
Notasi yang digunakan :
n = banyak tanda (+) dan tanda (–) dalam sampel
= proporsi SUKSES dalam sampel
= 1 –
= proporsi SUKSES dalam
= 1 –
Standar Error = Galat Baku =
Rata-Rata Sampel =
Statistik Uji
SUKSES tergantung dari apa yang ditanyakan (ingin diuji) dalam soal.
Jika yang ingin diuji sampel 1 > sampel 2 maka SUKSES adalah banyak tanda (+)
Jika yang ingin diuji sampel 1 < sampel 2 maka SUKSES adalah banyak tanda (–)
Nilai disesuaikan dengan nilai pengujian p yang diinginkan dalam soal
atau jika ingin diuji proporsi sampel 1 = proporsi sampel 2 maka = = 0.50
Penetapan Penetapan dan H:
1Terdapat 3 alternatif H dan H:
(a) H: p = dan H: p<
Uji 1 arah dengan daerah penolakan H: z <
(b) H: p = dan H: p >
Uji 1 arah dengan daerah penolakan H: z >
(c) H: p = dan H: p
Uji 2 arah dengan daerah penolakan H: z < dan z >
Contoh 1a:
Berikut adalah nilai preferensi konsumen terhadap 2 Merk Sabun Mandi. Dengan taraf nyata 1%, ujilah apakah proporsi preferensi konsumen pada kedua merk bernilai sama?
No. Responden
LUXE
GIVE
Tanda

1.
4
2
+

2.
2
3

3.
3
3
0

4.
2
3

5.
3
2
+

6.
1
2

7.
2
3

8.
3
4

9.
3
2
+

10.
2
1
+

11.
4
1
+

12.
1
1
0

13.
4
2
+

14.
3
2
+

15.
4
3
+
Banyak tanda (+) = 8 Banyak tanda (–) = 5 n = 8 + 5 = 13
Jika kita asumsikan LUXE lebih disukai dibanding GIVE maka SUKSES dalam sampel adalah = proporsi banyak tanda (+) dalam sampel
=
= 1 – = 1 - 0.62 = 0.38
Karena ingin diuji proporsi yang suka LUXE = GIVE maka = = 0.50
Langkah Pengujian:
1. : p = 0.50 : p ≠ 0.50
2. Statistik Uji : z
3. Uji: 2 Arah
4. Taraf Nyata Pengujian = α = 1% → α/2 = 0.5% = 0.005
5. Daerah Penolakan H
z < z z < -2.575 dan z > z > 2.575
6. Nilai statistik Uji :
= 0.8653...
≈ 0.87
7. Kesimpulan:
z hitung = 0.87 ada di daerah penerimaan diterima
Proporsi konsumen yang menyukai LUXE masih sama dengan yang menyukai
GIVE.
Contoh 1b:
Dengan menggunakan data pada Tabel 1 dan taraf nyata 1% ujilah apakah proporsi preferensi konsumen pada sabun LUXE dibanding sabun GIVE sudah lebih dari 0.30?
= 0.30
= 1 - 0.30 = 0.70
1. : p = 0.30 : p > 0.30
2. Statistik Uji : z
3. Uji 1 Arah
4. Taraf Nyata Pengujian = α = 1% = 0.01
5. Daerah Penolakan H
z > z→ z > 2.33
6. Nilai statistik Uji :
2.5177...
≈ 2.52
7. Kesimpulan:
z hitung = 2.52 ada di daerah penolakan H,
ditolak H diterima
01Proporsi konsumen yang menyukai LUXE sudah lebih dari 0.30
3. Uji Peringkat 2 Sampel Mann-Whitney
Uji ini merupakan alternatif uji beda 2 rata-rata Parametrik dengan menggunakan t (Sampel-sampel berukuran kecil).
Langkah pertama pengujian ini adalah pengurutan nilai mulai dari yang terkecil hingga terbesar. Pengurutan dilakukan tanpa pemisahan kedua sampel.
Selanjutnya lakukan penetapan Rank (Peringkat) dengan aturan berikut:
Peringkat ke -1 diberikan pada nilai terkecil di urutan pertama
Peringkat tertinggi diberikan pada nilai terbesar
Jika tidak ada nilai yang sama maka urutan = peringkat
Jika ada nilai yang sama, maka ranking dihitung dengan rumus
Peringkat (R) =
Contoh 2a: Berikan peringkat (ranking) data dalam tabel berikut ini!
Tabel 2. Nilai UAS Statistika 2
Mahasiswa Fak. Ekonomi
Mahasiswa Fak. Ilmu Komputer
Nilai
Urutan
Rangking
Nilai
Urutan
Ranking
30
2
2
25
1
1
55
4
4
50
3
3
65
5
5
70
6
7
70
8
7
70
7
7
75
10
9.5
75
9
9.5
88
16
15.5
78
11
11
90
17
17
80
12
12
95
18
18
85
13
13.5
98
19
19
85
14
13.5
100
20
20
88
15
15.5
117
93
Ranking untuk Nilai 70 =
Ranking untuk Nilai 75 =
Notasi yang digunakan
Jumlah peringkat dalam sampel ke 1
Jumlah peringkat dalam sampel ke 2
ukuran sampel ke 1
ukuran sampel ke 2 Ukuran kedua sampel tidak harus sama
Rata-rata
Rata-rata
Standar Error (Galat Baku) =
Statistik Uji
Dalam perhitungan hanya yang digunakan, karena ia menjadi subyek dalam dan :
Penetapan H dan : Terdapat 3 alternatif H dan H:
(a) H: dan H:
Uji 1 arah dengan daerah penolakan H: z <
(b) H: dan H:
Uji 1 arah dengan daerah penolakan H: z >
(c) H: dan H :
Uji 2 arah dengan daerah penolakan H: z < dan z >
Contoh 2b:
Berdasarkan Tabel 2 (lihat Contoh 2a), ujilah dengan taraf nyata 5%, apakah (peringkat) nilai mahasiswa Fak, Ekonomi lebih besar dibanding mahasiswa Ilmu Komputer?
1. :
2. Statistik Uji : z
3. Uji 1 Arah
4. Taraf Nyata Pengujian = α = 5% = 0.05
5. Daerah Penolakan H
z > z > 1.645
Luas daerah ini =
6. Nilai statistik Uji :
117 93
10 10
7. Kesimpulan:
z hitung = 0.91 ada di daerah penerimaan, diterima
(Peringkat) nilai UAS Statistika 2 di Fakultas Ekonomi = Fakultas Ilmu Komputer.
4. Uji Peringkat 2 Sampel Wilcoxon
Prinsip pengerjaannnya sama dengan Uji Peringkat 2 Sampel Mann-Whitney, hanya fokus kini dialihkan sampel dengan ukuran terkecil.
Notasi yang digunakan :
ukuran sampel ke 1
ukuran sampel ke 2
ukuran sampel ke 1 selalu lebih kecil dari sampel ke 2
W = jumlah peringkat pada sampel berukuran terkecil
Nilai Ekspektasi (W) = E(W) =
Standar Error = SE =
Statistik Uji z =
Penetapan urutan, peringkat dan dan H sama dengan Uji Mann-Whitney
Contoh 3: Berikut adalah data pendapatan di 2 kelompok pekerja
Tabel 3. Pendapatan Karyawan
Departemen Q
Departemen Z
Income
(ribu USD/tahun)
Urutan
Rangking
Income
(ribu USD/tahun)
Urutan
Ranking
6
1
1
12
3
3
10
2
2
13
4
4
15
7
6
15
5
6
32
10
10
15
6
6
W =
19
20
8
8
31
9
9
38
11
11
40
12
12
Dengan taraf nyata 5% ujilah apakah (peringkat) pendapatan di departemen Q lebih kecil dibandingkan departemen Z?
1. :
2. Statistik Uji : z
3. Uji 1 Arah
4. Taraf Nyata Pengujian = α = 5% = 0.05
5. Daerah Penolakan H
z < – z < –1.645
6. Nilai statistik Uji :
4 8
W = 19
E(W) =
z =
7. Kesimpulan:
z hitung = –1.19 ada di daerah penerimaan, diterima
Peringkat Pendapatan di kedua departemen sama
5. Uji Korelasi Peringkat Spearman
Dua uji terakhir (Mann-Whitney dan Wilcoxon) ditujukan untuk 2 sampel yang saling bebas (independen), sedangkan Uji Peringkat Spearman ditujukan untuk penetapan peringkat data berpasangan.
Konsep dan interpretasi nilai Korelasi Spearman () sama dengan konsep Koefisien Korelasi pada Regresi (Linier Sederhana).
Notasi yang digunakan:
n = banyak pasangan data
= selisih peringkat pasangan data ke i
= Korelasi Spearman
Statistik Uji z =
Penetapan H dan : Terdapat 3 alternatif H dan H:
(a) H: R = 0 (korelasi bernilai 0, tidak ada hubungan /tidak ada kecocokan)
: R < 0 (korelasi negatif)
Uji 1 arah dengan daerah penolakan H: z <
(b) H: R = 0 (korelasi bernilai 0, tidak ada hubungan /tidak ada kecocokan)
: R > 0 (korelasi positif)
Uji 1 arah dengan daerah penolakan H: z >
(c) H: R = 0 (korelasi bernilai 0, tidak ada hubungan /tidak ada kecocokan)
: R 0 (ada korelasi/ada kecocokan, korelasi tidak sama dengan 0)
Uji 2 arah dengan daerah penolakan H: z < dan z >
Peringkat diberikan tergantung kategori penilaian.
Jika ada item yang dinilai ber-peringkat sama, maka penetapan peringkat seperti dalam Mann-Whitney dapat dilakukan (ambil rata-rata peringkatnya!)
Contoh 5:
Dua orang pakar (ahli) diminta memberikan peringkat kinerja pada 10 Bank di Indonesia. Peringkat diberikan mulai dari bank terbaik = peringkat 1 sedang yang terburuk diberi peringkat 10. Hasilnya disajikan dalam Tabel 4.
Tabel 4. Hasil peringkat 10 Bank oleh 2 Pakar
Bank
Ranking
Pakar I
Rangking
Pakar II
A
4
3
1
1
B
5
1
4
16
C
3
4.5
-1.5
2.25
D
7
6
1
1
E
10
8
2
4
F
1
2
-1
1
G
6
4.5
1.5
2.25
H
2
7
-5
25
I
8.5
10
-1.5
2.25
J
8.5
9
-0.5
0.25
Σ =
55
Dengan taraf nyata 5% ujilah apakah apa korelasi antara peringkat yang diberikan kedua pakar?
1. : R = 0 : R 0
2. Statistik Uji : z
3. Uji 2 Arah
4. Taraf Nyata Pengujian = α = 5% α/2 = 2.5% = 0.025
5. Daerah Penolakan H
z < z z < -1.96 dan z > z > 1.96
6. Nilai statistik Uji :
z =
7. Kesimpulan:
z hitung = 2.01 ada di daerah penolakan H
ditolak H diterima
Ada korelasi/ada kecocokan pemberian peringkat oleh kedua pakar,
6. Uji Konkordansi Kendall
Pengujian sampel berpasangan ganda (multiple-paired samples).
Orang yang memberi peringkat lebih dari 2.
Statistik Uji yang digunakan : (chi kuadrat) dengan derajat bebas (db) = n-1
Notasi yang digunakan
n = banyak pasangan data, n ≥ 8
R = jumlah peringkat
k = banyak orang yang memberi peringkat (k >2)
Statistik Uji **)
**) sumber di Diktat Statistika-2, Gunadarma agak rancu…?
Sumber lain belum saya temukan. Yang paling mendekati ada di http://www.analystsoft.com/en/products/statplus/content/help/src/analysis_nonparametric_statistics_comparing_multiple_dependent_samples_friedman_anova_kendall_concordance.html
Contoh 6:
Tiga konsultan Teknologi Informasi (TI) diminta memberi peringkat pada 8 merk laptop.
Dengan taraf nyata 5% ujilah apakah terdapat kecocokan peringkat? (lihat Tabel di bawah)
Merk Laptop
Pakar 1
Pakar 2
Pakar 3
R
R2
A
3
2
4
9
81
B
2
5
3
10
100
C
1
1
2
4
16
D
5
3
1
9
81
E
8
4
7
19
361
F
6
7
5
18
324
G
7
6
8
21
441
H
4
8
6
18
324
ΣR2 = 1728
Jawab:
1. : RKendall = 0 (tidak ada korelasi/tidak ada kecocokan)
*: RKendall 0 (ada korelasi/ada kecocokan)
2. Statistik Uji :
3. Taraf Nyata Pengujian = α = 5% = 0.05
4. db = n –1 = 8 – 1 = 7 dan χ² tabel (db; α) = 14.06713
5. Daerah Penolakan H jika χ² > χ² tabel (db; α) χ² > 14.06713
6. Nilai statistik Uji :
== 15
7. Kesimpulan:
χ²hitung = 15 ada di daerah penolakan maka ditolak dan H* diterima
Ada kecocokan peringkat.
7. Uji Run(s)
Uji Run(s) digunakan untuk menguji keacakan dalam suatu sampel.
Run adalah satu atau lebih lambang-lambang yang identik yang didahului atau diikuti oleh suatu lambang yang berbeda atau tidak ada lambang sama sekali.
Misal: LLL PPP L P L PPPP L P LLLLLL terdapat 9 runs
Run ke 1 2 3 4 5 6 7 8 9
Statistik Uji yang digunakan = z
Notasi yang digunakan
banyak lambang 1 dalam sampel > 10
banyak lambang 2 dalam sampel > 10
n = +
banyak run(s)
Rata-rata Run(s) =
Standar Deviasi Run(s) =
Statistik Uji z =
Penetapan H
: Susunan Acak (Random)
: Susunan Tidak Acak (Tidak Random)
Uji 2 arah dengan daerah penolakan H: z < dan z >
Contoh 7:
Berikut adalah urutan duduk mahsiswa dan mahasiswi dalam suatu kelas:
LL P L PP L P L P L P LL P LLLLLLL PP L P LL PP LLLLLL
L = Laki-laki, P = Perempuan
Dengan taraf nyata 5%, ujilah apakah urutan ini sudah random?
= banyak L = 24 = banyak P = 12 banyak runs = 19
1. : susunan acak : susunan tidak acak
2. Statistik Uji : z
3. Uji 2 Arah
4. Taraf Nyata Pengujian = α = 5% α/2 = 2.5% = 0.025
5. Daerah Penolakan H
z < z z < -1.96 dan z > z > 1.96
6. Nilai statistik Uji :
===
= 2.618615 2.62
19
=
7. Kesimpulan:
z hitung = 0.76 ada di daerah penerimaan
* diterima. Susunan acak.
Catatan akhir:
Terdapat banyak ragam perhitungan Statistika Non-parametrik lainnya, mahasiswa sangat dianjurkan mempelajari sendiri berbagai teknik perhitungan Statistika Non Parametrik tersebut.
Selesai