Seperti yang telah saya bahas pada postingan yang lalu mengenai model regresi dengan adanya beberapa pelanggaran terhadap asumsi klasik yaitu terjadinya heteroskedastisitas dan tidak terpenuhinya normalitas pada distribusi data sampel. Untuk itu model regresi yang ada yaitu Salary = \beta 1 + \beta 2 Salbegin + \beta 3 Educ+ \beta 4 Prevexp + \mu harus diubah terlebih dahulu menjadi model Semi-Log dengan semua variabel independen/bebas dalam bentuk logaritma natural sehingga persamaan regresi menjadi LnSalary = \beta 1 + \beta 2 LnSalbegin + \beta 3 LnEduc+ \beta 4 LnPrevexp + \mu
Selanjutnya dapat kita mulai untuk melakukan analisis
- Buka file Employee.xls yang pernah dibuat pada model regresi dengan pelanggaran asumsi klasik tanpa menyertakan variabel absolut residual (Abs_res1), dengan perintah File, Open, Data.
- Merubah semua variabel menjadi bentuk logaritma natural dengan memberi nama variabel menjadi LnSalary, LnSalbegin, LnEduc dan LnPrevex.
- Merubah variabel menjadi bentuk logaritma natural dilakukan dengan perintah Transform dan Compute.
- Dari menu utama SPSS, pilih Analyze kemudian submen Regression, lalu pilih Linear.
- Tampak di layar Windows Linear Regression.
- Pada kotak Dependent isikan variabel Salary
- Pada kotak Independent isikan variabel LnSalbegin, LnEduc dan LnPrevex.
- Pada kotak Method, pilih Enter.
- Untuk mendapatkan nilai residual dari persamaan regresi ini, pilih Save dan pilih Unstandardized Residual.
- Untuk menguji asumsi klasik Multikolinearitas, pilih statistics dan aktifkan Covariance Matrix dan Collinearity Diagnostics.
- Untuk menguji asumsi klasik Autokorelasi aktifkan kotak Durbin-Watson.
- Lalu tekan Continue.
- Untuk menguji asumsi klasik Homoskedastisitas, pilih Plots dan isikan pada kotak Y dengan SRESID dan pada kotak X dengan ZPRED.
- Untuk menguji asumsi klasik normalitas residual aktifkan Histogram dan Normal Probability Plots.
- Tekan Continue dan abaikan yang lain lalu tekan OK.
Interpretasi Output SPSS
Dengan model regresi Semi-Log dimana semua variabel independen/bebas berbentuk logaritma natural hasilnya tidak terdapat multikolinearitas antara variabel independennya. Nilai Tolerance tidak ada yang di bawah 0.10 dan nilai VIF tidak ada yang di atas 10. Begitu juga dengan matrik korelasi tidak ada korelasi antar variabel independen di atas 0.90.
Nilai Durbin-Watson sekarang turun menjadi 1.777 dan nilai ini terletak antara dl = 1.739 dan du = 1.799 yang berarti tidak dapat diputuskan (undecided).
Uji normalitas residual masih menunjukkan nilai residual tidak terdistribusi secara normal, hal ini dapat dilihat dari grafik Normal Probability Plot. Garis observasi masih jauh dari garis diagonalnya. Untuk lebih meyakinkan maka kita uji dengan Kolmogorov-Smirnov.
- Dari menu utama SPSS pilih Analyze, lalu pilih Non-Parametrik Test, lalu pilih 1-sample K-S.
- Akan tampak windows one-sample-kolmogorov-smirnov-test.
- Pada kotak Test Variable List isikan Unstandardized Residual.
- Pada Test Distribution pilih Normal.
Interpretasi Output SPSS
Catatan: lihat uji Lilieford
Disini walaupun menggunakan Tes One Sample Kolmogorov-Smirnov namun hasil uji statistik yang ditampilkan adalah nilai Liliefors. Terlihat bahwa nilai Test Statistic Lilieford sebesar 0.092 dengan tingkat signifikansi 0.000 yang berarti nilai residual tidak terdistribusi secara normal. Karena nilai Test Statistic (0.092) dengan tingkat signifikan 0.000 lebih besar daripada nilai Lilieford tabel (0.886 / sqrt(450) = 0.042) dengan tingkat signifikansi 0.05.
Hasil uji Scatter Plots menunjukkan bahwa masih terjadi Heteroskedastisitas, hal ini terlihat dari hasil observasi yang tidak tersebar secara acak di sekitar titik 0 pada sumbu Y. Untuk lebih meyakinkan kita uji Heteroskedastisitas dengan uji Glejser sebagai berikut.
- Transformasikan nilai residual menjadi nilai absolute residual (RES_1) dengan perintah Transform dan Compute.
- Lakukan regresi RES_1 terhadap variabel independen LnSalbegin, LnEduc dan LnPrevex.
Interpretasi Output SPSS
Terlihat masih ada variabel independen yang signifikan dalam hal ini LnSalbegin, maka dapat disimpulkan masih terjadi Heteroskedastisitas.
Secara keseluruhan dapat disimpulkan bahwa model Semi-Log dengan semua variabel independen dirubah dalam bentuk logaritma natural ternyata masih menyalahi asumsi klasik normalitas residual dan adanya Heteroskedastisitas.
Langkah berikutnya kita merubah model regresi kita dengan model Semi-Log dan hanya variabel dependen yang dirubah dalam bentuk logaritma natural sedangkan variabel independen tetap, jadi persamaannya menjadi LnSalary = \beta 1 + \beta 2 Salbegin + \beta 3 Educ+ \beta 4 Prevexp + \mu
Selanjutnya dapat kita mulai untuk melakukan analisis
- Dari menu utama SPSS, pilih Analyze kemudian submen Regression, lalu pilih Linear.
- Tampak di layar Windows Linear Regression.
- Pada kotak Dependent isikan variabel LnSalary
- Pada kotak Independent isikan variabel Salbegin, Educ dan Prevex.
- Pada kotak Method, pilih Enter.
- Untuk mendapatkan nilai residual dari persamaan regresi ini, pilih Save dan pilih Unstandardized Residual.
- Untuk menguji asumsi klasik Multikolinearitas, pilih statistics dan aktifkan Covariance Matrix dan Collinearity Diagnostics.
- Untuk menguji asumsi klasik Autokorelasi aktifkan kotak Durbin-Watson.
- Lalu tekan Continue.
- Untuk menguji asumsi klasik Homoskedastisitas, pilih Plots dan isikan pada kotak Y dengan SRESID dan pada kotak X dengan ZPRED.
- Untuk menguji asumsi klasik normalitas residual aktifkan Histogram dan Normal Probability Plots.
- Tekan Continue dan abaikan yang lain lalu tekan OK.
Interpretasi Output SPSS
Dengan regresi Semi-Log yaitu variabel dependen dalam bentuk logaritma natural dan semua variabel independen tetap dirubah, dapat disimpulkan tidak terdapat multikolinearitas hal ini ditunjukkan oleh nilai Tolerance di atas 0.10 dan nilai VIF kurang dari 10. Begitu juga dengan hasil matrik korelasi antar variabel independen tidak ada yang berkorelasi di atas 0.90
Nilai Durbin-Watson sebesar 1.864 yang berada di atas nilai tabel du = 1.799 yang berarti tidak ada autokorelasi. Begitu juga dengan uji normalitas terlihat bahwa grafik normal probability plots garis observasi mendekati atau menyentuh garis diagonalnya yang berarti nilai residual terdistribusi secara normal. Untuk meyakinkan kita perlu lakukan uji dengan Kolmogorov-Smirnov yang hasilnya sebagai berikut.
Catatan: lihat uji Lilieford
Dari hasil tes distribusi normal terlihat bahwa nilai Test Statistic Lilieford sebesar 0.046 dengan tingkat signifikansi 0.020 yang berarti nilai residual terdistribusi secara normal. Karena nilai Test Statistic (0.046) dengan tingkat signifikan 0.02 lebih kecil daripada nilai Lilieford tabel (0.886 / sqrt(450) = 0.042) dengan tingkat signifikansi 0.05.
Namun demikian, hal ini terlihat dari hasil observasi tidak menyebar secara acak disekitar titik 0 pada sumbu Y. Untuk meyakinkan kita perlu uji dengan Uji Glejser dan hasilnya seperti berikut
Ternyata masih ada satu variabel independen yang masih signifikan yaitu variabel Salbegin. Jadi dapat disimpulkan bahwa model regresi masih menyalahi asumsi klasik Homoskedastisitas.