Seperti judul postingannya, Model regresi dan pelanggaran asumsi klasik. Jadi bisa anda tafsirkan sendiri bahwa model regresi ini tidak memenuhui persyaratan yang ditentukan dari asumsi klasik, seperti harus berdistribusi normal, tidak terjadi autokorelasi, multikolinearitas maupun heteroskedastisitas dan harus linear model tersebut. Jika terjadi satu atu dua pelanggaran saja terhadap asumsi klasik maka harus diobati agar model regresi tersebut memberikan hasil yang sebenarnya.
Untuk memberikan gambaran yang jelas berikut ini akan diberikan contoh komprehensif/menyeluruh tentang regresi OLS dengan penyimpangan asumsi klasik normalitas dan heteroskedastisitas, berikut cara mengobatinya.
Kita ambil contoh file Employee.xls yang merupakan bawaan contoh soal dari paket program SPSS. Di sini ingin diuji pengaruh variabel independen/bebas Salbegin (gaji awal), Educ (lama pendidikan) dan Prevexp (pengalaman kerja sebelumnya) terhadap variabel dependen/terikat Salary (gaji akhir) dengan persamaan regresi berganda sebagai berikut :
Salary = \beta 1 + \beta 2 Salbegin + \beta 3 Educ+ \beta 4 Prevexp + \muLangkah Analisis SPSS
- Buka file Employee.xls
- Dari menu utama SPSS, pilih menu Analyze kemudian submenu Regresion, lalu pilih Linear.
- Tampak di layar Windows Linear Regression.
- Pada kotak Dependent isikan variabel Salary.
- Pada kotak Independent isikan variabel Salbegin, Educ dan Prevexp.
- Pada kotak Method pilih Enter.
- Untuk menguji multikolinearitas dan autokorelasi, pilih Statistics
- Pada Regression Coeficient pilih Estimate dan Model Fit untuk mendapatkan nilai R2 dan nilai F test. Kemudian pilih Covarian matrik dan Collinearity diagnostic untuk menguji ada tidaknya multikolinearitas antara variabel independen/bebas.
- Pada Residual pilih Durbin Watson untuk menguji ada tidaknya autokorelasi antar residual dalam model.
- Kemudian pilih Continue.
- Untuk menguji asumsi klasik normalitas residual dan heteroskedastisitas dengan metode grafik pilih Plots.
- Pada Standardized Residual Plots pilih Histogram dan Normal Probability Plots. Perintah ini untuk menguji apakah residual dari model regresi terdistribui secara normal.
- Pada sumbu Y isikan SRESID dan pada sumbu X isikan ZPRED. Perintah ini untuk menguji ada tidaknya heteroskedastisitas.
- Pilh Continue.
- Cara lain untuk menguji Normalitas Residual dengan uji Non-Parametrik Kolmogorov-Smirnov. Untuk itu pilih Save.
- Pada kotak Residual pilih Unstandardized. Perintah ini meminta SPSS untuk menyimpan nilai residual yang nanti akan kita uji normalitasnya dengan uji Kolmogorov-Smirnov.
- Pilih Continue dan abaikan yang lain, lalu pilih OK.
Interpretasi Output SPSS
Berdasarkan tampilan output matrix korelasi antar variabel independen terlihat bahwa tidak terjadi multikolinearitas atau korelasi antara variabel independen yang tinggi di atas 90%. Hal ini juga ditegaskan dari hasil nilai VIF tidak ada yang nilainya lebih dari 10 dan nilai tolerance yang di bawah 0.10. Jadi dapat disimpulkan bahwa tidak terjadi multikolinearitas.
Nilai Durbin-Watson sebesar 1.832, nilai kita bandingkan dengan nilai tabel Durbin-Watson dengan K = 3 dan n = 200 didapat nilai DL = 1.783 dan DU = 1.799. Oleh karena nilai Durbin-Watson 1.832 berada di atas nilai DU = 1.799, maka dapat disimpulkan tidak terjadi autokorelasi antara residual.
Berdasarkan pada grafik histogram maupun Norml P-P Plot residual terlihat jelas bahwa residual tidak terdistribusi secara normal. Hal ini terlihat dari data yang menyear jauh dari diagonal atau tidak mengikuti arah garis diagonal. Jadi dapat disimpulkan model regresi tidak memenuhi asumsi normalitas residual.
Hasil uji statistic Kolmogorov-Smirnov terhadap nilai residual juga menunjukkan bahwa residual tidak terdistribusi secara normal. Hal ini terlihat dari nilai Kolmogorov-Smirnov Z sebesar 2.664 dan signifikan pada 0.000 yang berarti Hipotesis nol Ho yang menyatakan bahwa residual normal ditolak.
Berdasarkan pada grafik scatterplos terlihat bahwa titik-titik tidak menyebar secara acak baik di atas maupun di bawah angka 0 pada sumbu Y. Hal ini dapat disimpulkan terjadi heteroskedastisitas pada model regresi.
Hasil uji Glejser yang meregres nilai absolut dari residual (Abs_res1) terhadap variabel independen Salbegin, Educ dan Prevexp terlihat di bawah ini:
Oleh karena variabel independen Salbegin dan Educ signifikan secara statistik mempunyai variabel dependen Abs_res1, maka dapat disimpulkan terjadi heteroskedastisitas pada model regresi.
Hasil regresi ternyata melanggar dua asumsi klasik yaitu asumsi normalitas residual dan asumsi heteroskedastisitas. Untuk mengobati terhadap pelanggaran asumsi klasik ini, model regresi kita rubah dalam bentuk semi-log yaitu sebelah kanan persamaan yaitu variabel dependen kita ubah menjadi bentuk logaritma natural (Ln) dan sebelah kiri persamaan tetap, atau sebaliknya semua variabel independen diubah menjadi logaritma natural dan variabel dependen tetap menjadi seperti di bawah ini.
Salary = \beta 1 + \beta 2 Ln Salbegin + \beta 3 Ln Educ+ \beta 4 Ln Prevexp + \muLn Salary = \beta 1 + \beta 2 Salbegin + \beta 3 Educ+ \beta 4 Prevexp + \mu
Atau dapat juga diubah menjadi bentuk double-lag yaitu sebelah kanan maupun kiri persamaan semua diubah dalam bentuk logaritma nautral seperti di bawah ini.
Ln Salary = \beta 1 + \beta 2 Ln Salbegin + \beta 3 Ln Educ+ \beta 4 Ln Prevexp + \mu