h1

Regresi dengan Variabel Independent Kualitatif

Juli 17, 2009

Variabel independent kualitatif adalah variable independent yang bertipe kualitatif, yaitu variable yang  nilai-nilainya berupa kategori. Misalnya variabel jenis kelamin (laki-laki,perempuan), status perkawinan (nikah, janda/duda, belum menikah). Apabila dalam  model regressi ganda terdapat variabel independent yang bertipe kualitatif, maka  perlu dibentuk beberapa variable dummy untuk “meng-kuantitatifkan” variabel tersebut. Variabel ini tidak mempunyai arti secara kuantitatif, tetapi hanya digunakan untuk mengidentifikasi perbedaan kategori dari variabel yang bertipe kualitatif. Selain itu dikenal juga istilah reference category yang menunjukan kategori yang akan dibandingkan dengan kategori yang lainnya untuk mengetahui ada tidaknya perbedaan. Banyaknya dummy variable yang harus dibentuk sama dengan banyaknya kategori dikurangi satu, kenapa harus dikurangi satu? Agar tidak terjebak kedalam dummy trap (Baca selengkapnya tentang Dummy trap disini).

Ilustrasi pembentukan dummy variabel sebagai berikut: Misal kita memiliki Variabel independent Status perkawinan yang terdiri dari 3 kategori yaitu nikah, janda/duda serta belum nikah, Jika kita mengambil reference category nikah maka variable dummy yang dibentuk adalah: D1 yang bernilai 1 untuk kategori janda/duda serta 0 untuk kategori lainnya dan D2 yang bernilai 1 untuk kategori belum nikah serta 0 untuk kategori lainnya.

Untuk variable independent kualitatif yang hanya terdiri dari 2 sampai dengan 5 kategori mungkin tidak ada kesulitan dalam pembuatan dummy variable nya, tapi bagaimana dengan variable independent kualitatif yang terdiri dari lebih dari 5 kategori? Tentunya kita akan sangat direpotkan untuk membuat dummy variable-nya.

Tapi jangan khawatir karena di R kita tidak perlu repot-repot membuat dummy variable jika ada satu atau lebih variable independent kualitatif yang akan di modelkan karena R secara otomatis akan membuat variable Dummy-nya sendiri dan menghasilkan model yang telah memuat setiap kategori di variable independent kualitatifnya. Sebagai contoh misalkan kita punya permasalahan sebagai berikut, Seorang peneliti ingin membandingkan 3 metode pengobatan (A, B, C) depresi berat. Dia juga ingin mengetahui hubungan antara umur dengan keefektifan metode pengobatan tersebut. Untuk itu dipilih 36 pasien secara random untuk tiap – tiap kelompok pengobatan. Buatlah sebuah model regresi untuk melihat hubungan antara, keefektifan obat (Y), Umur pasien (X1), dan metode pengobatan (X2). Data dapat didownload disini.
Untuk membentuk model regresi-nya dengan R cukup dengan mengetikkan syntax sebagai berikut:

> Data=read.spss(“C:/Soal/Dummy.sav”,use.value.labels=TRUE,
max.value.labels=Inf,to.data.frame=TRUE)#memanggil data SPSS dengan nama Dummy.sav di folder C:/Soal/
> summary(lm(Y~X1+X2,data=Data) #membentuk model regresi dengan variable independent Y,variable dependent X1 dan X2 serta nama data=Data)

Model Regresi yang didapat adalah:

Call:

lm(formula = Y ~ X1 + X2, data = Data)
Residuals:
     Min       1Q   Median       3Q      Max
-12.6383  -3.4367   0.9347   3.8504   9.5550

Coefficients:
               Estimate Std. Error t value Pr(>|t|)   
(Intercept)     32.8519     3.5714   9.199 1.68e-10 ***
X1               0.6613     0.0696   9.502 7.79e-11 ***
X2[T.B       ]  -9.9771     2.4581  -4.059 0.000297 ***
X2[T.C       ] -10.4234     2.4588  -4.239 0.000178 ***

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ‘ 1
Residual standard error: 6.019 on 32 degrees of freedom
Multiple R-squared: 0.7848,     Adjusted R-squared: 0.7646
F-statistic: 38.89 on 3 and 32 DF,  p-value: 8.746e-11

Dari output diatas dapat dilihat bahwa R secara otomatis membentuk dummy variable pada X2 dengan reference categorynya adalah A (Level awal dalam variabel), sehingga model regresi yang terbentuk adalah:
Y=32.8519 + 0.6613X1  , untuk X2=A
Y=32.8519 + 0.6613X1 – 9.9771  , untuk X2=B
Y=32.8519 + 0.6613X1 – 10.4234  , untuk X2=C

Bandingkan model regresi yang didapat dengan menggnakan software SPSS sebagai berikut yang tentunya telah dibuat variabel dummy-nya terlebih dahulu.

contoh regresi
[IMI]

Tinggalkan Balasan

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Ubah )

Twitter picture

You are commenting using your Twitter account. Log Out / Ubah )

Facebook photo

You are commenting using your Facebook account. Log Out / Ubah )

Connecting to %s

Ikuti

Get every new post delivered to your Inbox.