Tuesday, 13 October 2009

UJI PERSYARATAN ANALISIS UNTUK ANALISIS MULTIVARIAT

Umumnya, analisis multivariat atau metode multivariat berkaitan dengan metode-metode statistik yang secara bersama-sama (simultan) melakukan analisis terhadap lebih dari dua variabel. Dengan demikian, analisis multivariat dapat dikatakan lanjutan atau perluasan dari analisis univariat seperti (uji t/uji beda) dan bivariat (seperti korelasi dan regresi sederhana).
Variat bisa didefinisikan sebagai kombinasi linier dari variabel-variabel dengan bobot variabel yang ditentukan secara empiris, sebagai contoh persamaan multiple regression:

Nilai variat : w1X1 + w2X2 + w3X3…+ wnXn

Xn adalah variabel yang telah ditentukan oleh peneliti sedangkan wn adalah hasil dari proses multivariat. Nilai variat adalah hasil dari proses penjumlahan dan perjalian w dan X, yang menghasilkan suatu nilai variat tertentu.
Dalam melakukan analisis multivariat, sebelumnya diperlukan uji persyaratan analisis terhadap data yang telah dikumpulkan dalam penelitian, uji persyaratan analisis ini sama dengan uji persyaratan analisis pada analisis univariat dan bivariat (uji normalitas, uji linieritas, dan uji homogenitas), namun ada penambahan persyaratan yang harus dipenuhi dalam analisis multivariat yaitu: 1) uji multikolinieritas, 2) uji heterokedasitas, 3) uji autokorelasi, 4) uji missing data dan 5) uji outlier.

Uji Multikolinieritas
Uji multikolinieritas dimaksudkan untuk mengetahui ada tidaknya hubungan (korelasi) yang signifikan antar variabel bebas. Jika terdapat hubungan yang cukup tinggi (signifikan), berarti ada aspek yang sama diukur pada variabel bebas. Hal ini tidak layak digunakan untuk menentukan kontribusi secara bersama-sama variabel bebas (X) terhadap variabel terikat (Y).
Dalam regresi X1,X2,X3,…Xn terhadap Y, apabila X1,X2,X3 …Xn saling berkombinasi linier atau berhubungan linier secara sempurna satu sama lain maka mereka saling tergantung (dependen). Dalam kasus ini koefisien regresi parsial tidak diperoleh karena persamaan normal tidak terselesaikan karena estimasi kuadrat terkecil tidak dapat dihitung. Saling tergantung secara sempurna jarang terjadi dalam penelitian. Akan tetapi masalah khusus, yang disebut dengan multikolinier bisa terjadi.
Multikolinieritas terjadi apabila dua atau lebih variabel bebas saling berkorelasi kuat satu sama lain. Bila terjadi multikolinieritas, estimasi kuadrat terkecil dapat dihitung tetapi terjadi kesulitan untuk menginterpretasikan efek dari tiap-tiap variabel.
Multikolinieritas dapat dideteksi dengan menghitung koefisien korelasi ganda dan membandingkannya dengan koefisien korelasi antar variabel. (keterangan lebih lanjut dan contoh aplikasinya dapat dilihat di slideshare dengan judul yang sama pada konten ini).
Uji Heterokedasitas
Heterokedastisitas terjadi dalam regresi apabila varian error (εi) untuk beberapa nilai x tidak konstan (berubah-ubah). Pendeteksian konstan dan tidaknya varian error konstan dapat dilakukan dengan menggambar grafik antara dengan residu (). Apabila garis yang membatasi sebaran titik-titik relatif paralel maka varian error dikatakan konstan. (keterangan lebih lanjut dan contoh aplikasinya dapat dilihat di slideshare dengan judul yang sama pada konten ini).
Uji Autokorelasi
Autokorelasi terjadi dalam regresi apabila dua error dan tidak independent atau . Autokorelasi biasanya terjadi apabila pengukuran variabel dilakukan dalam interval waktu tertentu. Hubungan antara dengan dapat dinyatakan dalam persamaan matematika berikut:


menyatakan koefisien autokorelasi populasi, apabila = 0, maka autokorelasi tidak terjadi. Apabila autokorelasi terjadi, maka akan mendekati +1 atau -1. Memprediksi terjadinya autokorelasi dapat dilakukan dengan diagram antara grafik dengan sangat sulit. Deteksi autokorelasi umumnya dilakukan dengan uji statistik Durbin-Watson dengan menggunakan rumus matematika :


Nilai d berkisar antara 0 dan 4, yaitu 0 ≤ d ≤ 4. Autokorelasi tidak terjadi apabila nilai d = 2. apabila terjadi autokorelasi possitif, maka selisih antara et dengan et-1 sangat kecil dan d mendekati 0, sebaliknya, apabila terjadi autokorelasi negatif, maka selisih antara et dengan et-1 relatif besar dan d mendekati 4. (keterangan lebih lanjut dan contoh aplikasinya dapat dilihat di slideshare dengan judul yang sama pada konten ini).

Uji Missing Data
Missing data atau missing value adalah informasi yang tidak tersedia untuk sebuah subyek (kasus). Dalam terminologi SPSS, missing data adalah adanya sel-sel kosong pada satu atau beberapa variabel. Missing data terjadi karena informasi untuk sesuatu tentang obyek tidak diberikan, sulit dicari atau memang informasi tersebut tidak ada.
Sebagai contoh, pada data umur atau usia responden dan data gaji, bisa saja ada responden yang karena alasan pribadi tidak bersedia memberikan informasi tentang gaji mereka dan usia mereka.
Missing data sebenarnya tidak bermasalah bagi keseluruhan data, apalagi jika jumlahnya hanya sedikit, misalnya hanya sekitar 15% dari seluruh data. Namun jika persentase data yang hilang tersebut cukup besar, maka perlu dilakukan pengujian apakah data yang mengandung banyak missing tersebut masih layak diproses lebih lanjut ataukah tidak. (keterangan lebih lanjut dan contoh aplikasinya dapat dilihat di slideshare dengan judul yang sama pada konten ini).

Uji Outlier
Data outlier adalah data yang secara nyata berbeda dari data-data yang lainnya. Sebagai contoh, data dari 100 tinggi badan mahasiswa UNDIKSHA Singaraja-Bali, ternyata ditemukan adanya data tinggi badan 199 cm. tinggi badan tersebut jelas bersifat ekstrim dibandingkan dengan rata-rata tinggi badan orang asia pada umumnya, misalnya sekitar 160 cm sampai 175 cm. data 199 cm inilah yang disebut dengan data outlier. Data outlier bisa terjadi karena beberapa hal:
kesalahan dalam pemasukan data. Terkait dengan contoh diatas, ternyata data yang seharusnya 166 cm dimasukkan menjadi 199cm.
kesalahan pada pengambilan sampel. Terkait dengan contoh di atas, mereka mengambil sampel orang bule yang kuliah di sana.
Memang ada data-data ekstrim yang tidak bisa dihindarkan keberadaannya. Terkait dengan contoh di atas, memang ada banyak mahasiswa UNDIKSHA yang benar-benar mempunyai tinggi badan 199 cm.
(keterangan lebih lanjut dan contoh aplikasinya dapat dilihat di slideshare dengan judul yang sama pada konten ini).


Referensi:
Candiasa, I Made. 2007. Statistik Multivariat disertai Petunjuk Analisis dengan SPSS. Program Pascasarjana Universitas Pendidikan Ganesha. Singaraja.
Santoso, Singgih. 2003. Buku Latihan SPSS Statistik Multivariat. PT. Elex Media Komputindo. Jakarta.

1 comment:

Young Jedi said...

Saya terus terang saja agak bingung dengan penjelasan Mas Gunawan di atas (walaupun itu mungkin berasal dari buku-buku yg menjadi reference), karena ada beberapa hal yg perlu diingat:
(a) tidak setiap analisis multivariat. ada juga yang sekedar algoritma perhitungan saja. Misalnya, analisis klaster. artinya untuk yg jenis tidak perlu ada (misalnya) normalitas data dlsb.
(b) konsekwensi dari poin (a) adalah tiap metode membutuhkan persyarata/"asumsi" yang berbeda-beda.
Tulisan di atas lumayan, tapi masih membutuhkan eksplorasi.

www.gudono.com