07 November 2008

Tips: Mengestimasi Perbedaan Rata-rata Dua Kelompok Observasi

Regresi dengan variabel dummy dapat digunakan untuk mengestimasi perbedaan variabel antar dua kelompok observasi. Misalnya kita ingin menghitung apakah upah buruh laki-laki dan perempuan yang berkerja di sebuah/beberapa perusahaan berbeda secara statistik, dan jika ya berapa besar perbedaannya (nilai rata-rata). Atau ingin mengetahui perbedaan kesejahteraan sekelompok petani dengan sekelompok lainnya. Atau mungkin juga ingin mengetahui apakah ada perbedaan produktivitas pegawai setelah diikutkan pelatihan emotional quotient misalnya. Atau ingin tahu apakah jumlah uang beredar berbeda antara sebelum dan sesudah sebuah kebijakan moneter dikeluarkan oleh BI, dan lain-lain.

Misalnya untuk membedakan upah buruh laki-laki dan perempuan di tiga perusahaan tekstil (sebagai satu kelompok observasi), dengan menggunakan model seperti:

Y = a + bD + e ................(1),

di mana Y= besar upah yg diterima masing-masing buruh, D adalah variabel dummy laki-laki dan perempuan, e adalah faktor penggangu (error term), kita secara sederhana dapat menjawab dua pertanyaan sekaligus yaitu: 1) apakah upah buruh berbeda antara laki-laki dan perempuan atau tidak dan 2) jika ya, seberapa besarkah perbedaan rata-rata upah di antara keduanya.
Untuk menghasilkan jawaban pertanyaan itu, langkah-langkah yang dilakukan adalah, 1) kumpulkan data pendapatan masing-masing buruh laki-laki dan perempuan di tiga perusahaan tekstil tersebut (tentu saja dengan syarat kecukupan data dan metode sampling yang dapat dipertanggungjawabkan), 2) susun data dalam tabel sebagai berikut:

3) estimasi data tersebut dengan menggunakan persamaan (1), dan 4) baca hasilnya, misalnya:

Y = 593000 + 25513D ............(2)

Setelah yakin bahwa hasil regresi sudah baik (BLUE), hasil regresi sudah dapat dibaca.
Jika variabel dummy hasil regresi adalah signifikan secara statistik (t hitung melebihi t kritis, misalnya dengan alfa=5%, pengujian dua sisi) berarti rata-rata upah buruh laki-laki dan perempuan di tiga perusahaan tersebut berbeda secara statistik. Rata-rata upah buruh perempuan di tiga perusahaan tekstil adalah Rp 593.000, dan upah rata-rata laki-laki lebih tinggi sebesar adalah Rp 25.513 dari perempuan, yaitu sebesar Rp 618.513. Trus, kita tinggal mencari tahu sebab-sebab perbedaan ini. Ada apa? Tinggal buruh-buruh cewek berdemonstrasi deh, menuntut upah yang sama dengan para pria. Tapi, jika variabel D tidak signifikan, berarti rata-rata upah buruh perempuan dan upah buruh laki-laki di tiga perusahaan tekstil tersebut tidak berbeda, alias sama. Bagaimana jika tanda koefisien D negatif? Itu artinya upah buruh laki-laki lebih rendah dari upah perempuan (tentu saja jika signifikan). Jadi tanda tidak menunjukkan hubungan negatif atau positif seperti regresi dengan variabel independen X.
Model regresi dengan dummy saja (tanpa ada variabel independen X) seperti ini disebut dengan model regresi anova. Tapi berbeda kan dengan uji beda rata-rata anova di satitstika?