07 November 2008

Tips: Mengestimasi Perbedaan Rata-rata Dua Kelompok Observasi

Regresi dengan variabel dummy dapat digunakan untuk mengestimasi perbedaan variabel antar dua kelompok observasi. Misalnya kita ingin menghitung apakah upah buruh laki-laki dan perempuan yang berkerja di sebuah/beberapa perusahaan berbeda secara statistik, dan jika ya berapa besar perbedaannya (nilai rata-rata). Atau ingin mengetahui perbedaan kesejahteraan sekelompok petani dengan sekelompok lainnya. Atau mungkin juga ingin mengetahui apakah ada perbedaan produktivitas pegawai setelah diikutkan pelatihan emotional quotient misalnya. Atau ingin tahu apakah jumlah uang beredar berbeda antara sebelum dan sesudah sebuah kebijakan moneter dikeluarkan oleh BI, dan lain-lain.

Misalnya untuk membedakan upah buruh laki-laki dan perempuan di tiga perusahaan tekstil (sebagai satu kelompok observasi), dengan menggunakan model seperti:

Y = a + bD + e ................(1),

di mana Y= besar upah yg diterima masing-masing buruh, D adalah variabel dummy laki-laki dan perempuan, e adalah faktor penggangu (error term), kita secara sederhana dapat menjawab dua pertanyaan sekaligus yaitu: 1) apakah upah buruh berbeda antara laki-laki dan perempuan atau tidak dan 2) jika ya, seberapa besarkah perbedaan rata-rata upah di antara keduanya.
Untuk menghasilkan jawaban pertanyaan itu, langkah-langkah yang dilakukan adalah, 1) kumpulkan data pendapatan masing-masing buruh laki-laki dan perempuan di tiga perusahaan tekstil tersebut (tentu saja dengan syarat kecukupan data dan metode sampling yang dapat dipertanggungjawabkan), 2) susun data dalam tabel sebagai berikut:

3) estimasi data tersebut dengan menggunakan persamaan (1), dan 4) baca hasilnya, misalnya:

Y = 593000 + 25513D ............(2)

Setelah yakin bahwa hasil regresi sudah baik (BLUE), hasil regresi sudah dapat dibaca.
Jika variabel dummy hasil regresi adalah signifikan secara statistik (t hitung melebihi t kritis, misalnya dengan alfa=5%, pengujian dua sisi) berarti rata-rata upah buruh laki-laki dan perempuan di tiga perusahaan tersebut berbeda secara statistik. Rata-rata upah buruh perempuan di tiga perusahaan tekstil adalah Rp 593.000, dan upah rata-rata laki-laki lebih tinggi sebesar adalah Rp 25.513 dari perempuan, yaitu sebesar Rp 618.513. Trus, kita tinggal mencari tahu sebab-sebab perbedaan ini. Ada apa? Tinggal buruh-buruh cewek berdemonstrasi deh, menuntut upah yang sama dengan para pria. Tapi, jika variabel D tidak signifikan, berarti rata-rata upah buruh perempuan dan upah buruh laki-laki di tiga perusahaan tekstil tersebut tidak berbeda, alias sama. Bagaimana jika tanda koefisien D negatif? Itu artinya upah buruh laki-laki lebih rendah dari upah perempuan (tentu saja jika signifikan). Jadi tanda tidak menunjukkan hubungan negatif atau positif seperti regresi dengan variabel independen X.
Model regresi dengan dummy saja (tanpa ada variabel independen X) seperti ini disebut dengan model regresi anova. Tapi berbeda kan dengan uji beda rata-rata anova di satitstika?

12 September 2008

Histori: Nobel Memorial Prize 1980 untuk Lawrence R. Klein, kedua untuk Ekonometrika


Setelah lebih dari sepuluh tahun setelah Nobel Ekonomi khususnya di bidang Ekonometrika dianugerahkan kepada Tinbergen dan Frisch pada 1969, pada tahun 1980 Nobel Ekonomi dianugerahkan kembali kepada pengembang Ekonometrika, yaitu Lawrence Robert Klein dari Amerika Serikat.
Nobel Memorial Prize diberikan kepada Lawrence R. Klein (1920 - ) untuk karya ciptanya membangun model ekonometri dan aplikasinya untuk analisis fluktuasi ekonomi dan kebijakan ekonomi.

25 April 2008

Tips: Menghitung Pertumbuhan

Halo.…Sorry lama tidak muncul, berhubung ada beberapa trouble dalam mengakses blog ini. Ok, ini saya lanjutkan lagi..Masih mengenai problem-problem sederhana sehari-hari. Diskusi ini berdasarkan beberapa pertanyaan teman-teman mengenai variabel trend waktu dalam regresi. Misalnya, “bagaimana memasukkan waktu sebagai variabel independen dalam sebuah model regresi?”, “Apa manfaatnya?”, “Datanya bagaimana?”.
Banyak di antara kita yang sehari-hari memerlukan perhitungan tingkat pertumbuhan berbagai variabel ekonomi dalam penelitian kita, misalnya pertumbuhan PDB riil, pertumbuhan harga saham, pertumbuhan penduduk, dan lain-lain sepanjang periode tertentu (tahunan, kuartalan, bulanan, mingguan, harian, dll). Untuk kebutuhan itu, secara ringkas, dapat digunakan model semilog, seperti berikut:

LnPDBt = β0 + β1T + ut

Variabel dependen (PDB=produk domestik bruto) di-logaritma-natural-kan, variabel independennya adalah T, yaitu trend waktu. Data untuk variabel T adalah 1, 2, 3 dan seterusnya. Faktor kesalahan (error) ditunjukkan dengan ut, Dalam model ini, koefisien kemiringan (slope) mengukur perubahan relatif dari PDB berdasarkan perubahan nilai absolut variabel independenT.
Dengan mengalikan perubahan relatif variabel dependen (PDB) dengan 100, akan memberikan perubahan persentase, atau tingkat pertumbuhan variabel dependen untuk perubahan absolut pada variabel independen.
Misalnya dengan contoh hipotetis, observasi adalah yang digunakan kuartalan 1990.1-2006.4. Hasil regresi ditunjukkan sebagai berikut:

LnPDBt = 8,732 + 0,00982T

Interpretasi persamaan tersebut adalah, sepanjang periode 1990.1-2006.4, PDB tumbuh secara kuartalan pada tingkat 0,982 persen.

25 Januari 2008

Diskusi: Standardized Variables vs Unstandardized Variables

Diskusi ini saya ambil berdasarkan email di milis multivariate_SEM@yahoogroups.com yang diasuh Prof. Imam Ghozali. Biar yang lain juga bisa baca dari sumber ini, saya muatkan di sini dengan sedikit penyesuaian. Dan tentu saja diskusi yang saya angkat ini yang saya juga terlibat dalam menjawab email tersebut.
Pertanyaannya (dari bung Utomo – dapat dilihat di milis) sbb:
1. Bagaimana konsekuensinya jika yang dibaca adalah unstandardized coefficient, secara statistik/ekonometri?
2. Bagaimana konsekuensinya jika yang dibaca adalah standardized coefficient, secara statistik/ekonometri?
3. Apakah ada ketentuan untuk memilih penggunaannya?

Bagian dari diskusi milis dari saya:
Jika yang dimaksud standardized coef adalah beta coef (bukan koefisien beta di teori keuangan), berarti itu adalah koefisien parameter regresi dari standardized variables. Standardized variables adalah variabel-variabel yang datanya telah distandardisasi dengan standar deviasi masing-masing variabel, baik variabel dependen maupun variabel-variabel independennya.
Jadi, output regresi yang dihasilkan software tertentu (misalnya SPSS), beta coefficient/ standardized coefficient, dihasilkan melalui proses tersebut. Kalau yang unstandardized coef, berarti regresi dihasilkan dengan menggunakan variabel biasa (tidak distandardisasi), tetap menggunakan unit skala dan ukuran aslinya.
Bisa jadi kita melakukan regresi dengan standardized variable adalah untuk mendapatkan koefisien yang memiliki basis unit yang sama, sehingga (dalam multiple regression) kita dapat membandingkan secara langsung antar variabel indenpenden, dalam pengaruhnya masing-masing terhadap variabel dependen. Variabel dependen mana yang berpengaruh lebih besar terhadap variabel dependen dapat dilihat dari besar kecilnya masing-masing koefisien (beta) regressor.
Namun, ada beberapa hal yang perlu dicatat jika menggunakan beta coefficient. Pertama, model regresi kita merupakan regression trough the origin alias tidak lagi memiliki intersep. Untuk ukuran goodness of fit, kita tidak dapat lagi menggunakan R square biasa. Kedua, interpretasi koefisien (beta) jadi sulit, karena kita harus selalu mengkaitkannya dengan standar deviasi variabel.
*Tentu saja (jika besaran koefisien regresi dapat diinterpretasi) , unstandardized coef lebih baik dan mudah untuk dibaca, di samping itu dengan unstandardized variable, R square biasa dapat dipergunakan.*Keunggulan standardized coef (beta) adalah dapat membandingkan pengaruh variabel independen (seperti saya diskusikan di atas). Keunggulan ini juga dapat dihasilkan dengan regresi menggunakan variabel yang di-logaritma (natural)-kan, dengan kondisi tertentu.
Jadi silahkan dipilih mana yang akan digunakan. Juga sebenarnya standardized variable tidak tergantung skala atau unit pengukuran data lho.