09 Agustus 2010

Diskusi: Metode 2SLS dan Sistem Persamaan Simultan

Diskusi ini saya ambil dari milis Mutivariat-SEM@yahoogroups.com. Bagian ini adalah bagian di mana saya terlibat berdiskusi (menjawab pertanyaan anggota milis). Tulisan yang saya tampilkan di sini sudah saya sesuaikan agar tidak merugikan di penanya. Mudah-mudahan bermanfaat.


Tanya:
Langkah pertama dalam analisis 2SLS adalah meregresikan variabel endogen dengan semua variabel eksogen, yang ingin saya tanyakan, maksudnya variabel eksogen disini semua variabel dalam model atau variabel dalam satu persamaan itu saja, dalam contoh, penelitian saya:

Y1=a1+b1 Y2+ b2 X2+ b3 X3+ b4 X4+ e1
Y2=a2+b5 Y1+ b6 X2 + b7 X3+ b8 X8 + e2

Berarti langkah pertama dalam analisis 2SLS meregresikan Y1=a3 + b9X2+ b10X3+ b11X4+ b13X8+e3, dan di persaman 2 meregresikan Y2 =a4 + b14X2+ b15X3+ b16X4+ b17X8+e4, apakah benar begini? Langkah ini ditempuh menurut dari buku pak imam, itu untuk mencegah variabel endogen dividen berkorelasi dengan e2 dan hutang dengan e1, saya belum jelas maksud pernyataan ini, apakah akibatnya jika melalui tahapan ini Y1 tidak berkorelasi dengan e2 dan Y2 dengan e1. Mohon penjelasannya.

Jawab:
Asumsi saya, secara teoritik model ini sudah benar. Ada dua variabel endogen: Y1 dan Y2 dan empat predetermined variabel (variabel eksogen), yaitu: X1, X2, X3 dan X8. Langkah pertama, adalah melakukan identifikasi (untuk menentukan apakah persamaan ini just identified, overidentified, atau underidentified = tdk bisa diestimasi). Hasil identifikasi menentukan metode analisis yang digunakan. Konsep identifikasi dan metode regresi yang digunakan dapat dibaca di Gujarati and Porter (2009), atau Pindyck-Rubinfeld (1997). Tahap berikut menemukan persamaan reduced form. Secara ringkas, hasilnya bisa jadi seperti yang disebutkan di atas (endogen diregres dengan predetermined variable). Tapi langkah yang benar, reduced form diturunkan secara matematis dulu (lihat buku-buku ekonometri). Proses identifikasi tadi menentukan apakah kita bisa menghasilkan angka yang unik untuk persamaan struktural (persamaan utama) dari koefisien reduced form. Jika hasil identifikasi adalah just identified dan overidentified, maka akan dihasilkan angka koef regresi unik, jika underidentified, kita tidak akan mendapatkan angka koefisien regresi yang unik, alias tidak dapat diestimasi.
Pada dasarnya estimasi dari reduced form digunakan untuk menggantikan variabel endogen yang berada di sisi kanan masing-masing persamaan. Ya dari proes ini nanti diharapkan bahwa variabel endogen sisi kanan tidak berkorelasi dengan error pada persamaan tersebut.

Tanya:
Mohon dijelaskan kata simultan dalam persamaan simultan dengan simultan dalam persamaan OLS (1 persamaan) yang berarti secara bersama-sama berpengaruh terhadap Y, apakah perbedaan maksud simultan dalam 2SLS (2persamaan) dengan OLS (1 persamaan).

Jawab:
Sebenarnya persamaan estimasi dengan satu persamaan saja dinamakan persamaan tunggal, bukan OLS. OLS (ordinary least square) adalah nama salah satu metode regresi. Metode lainnya misalnya MLE (maximum likelihood estimation). Jika persamaan estimasi terdiri dari banyak persamaan yang saling kait-mengkait dinamakan sistem persamaan atau sistem persamaan simultan. Dalam hal ini 2SLS juga merode regresi (menggunakan prinsip yang sama dengan OLS, yaitu least squre – baca buku ekonometri – tetapi memiliki 2 tahap regresi. OLS satu tahap).
Sering terjadi salah pengertian makna simultan seperti di atas. Istilah ‘simultan’ dalam persamaan tunggal = satu persamaan (entah itu menggunakan metode OLS atau ML atau yang lain) biasanya digunakan orang untuk mengatakan ‘secara bersama-sama’ oleh lebih dari satu variabel X (independen). Misalnya untuk uji F, dikatakan bahwa secara bersama-sama (simultan) semua variabel indepnden signifikan mempengaruhi/tidak mempengaruhi variabel Y (dependen).
Istilah ‘simultan’ dalam pemahaman sistem persamaan simultan adalah saling kait-mengkait (pengaruh-mempengaruhi berdasarkan teori ekonomi) dalam suatu sistem persamaan. Contoh sistem persamaan yang memodelkan suatu perekonomian yang rumit di mana terdapat banyak persamaan (lebih dari satu, misalnya 2, seperti yang anda punya, atau bahkan puluhan persamaan, seperti persamaan makroekonometri untuk estimasi perekonomian suatu negara). Kemenkeu dan BI punya model makroekonometri seperti ini untuk simulasi makroekonomi. Persamaan simultan dalam prilaku mikro seperti SEM (SEM punya kekhasan adanya analisis factor did lm modelnya). Persamaan-persamaan ini saling kait-mengkait, melalui beberapa variabel di masing-masing persamaan. Misalnya, Y1 menjadi variabel eksogen di persamaan ke dua seperti contoh di atas. Atau, bisa dalam suatu sistem persamaan ini ada persamaan identitas yang mengkaitkan satu persamaan dengan persamaan lain. Dalam menganalisis hasil persamaan simultan satu-persatu persamaan, juga menggunakan uji-uji yang sama dengan yang dilakukan pada persamaan tunggal, seperti seperti misalnya pengujian asumsi klasik.

Tanya:
Apakah dalam 2SLS juga diperlukan uji asumsi klasik?

Jawab:
2SLS memerlukan uji asumsi klasik. Bahkan sistem persamaan simultan memiliki keunikan tersendiri, yang menunjukkan bahwa prasyarat asumsi klasik sangat penting untuk diperhatikan. Karena terdapat banyak persamaan, ada persamaan yang memiliki variabel endogen di sisi kanan tanda sama dengan. Asumsi bahwa variabel sisi kanan (X) nonstokasitik dan tidak berkorelasi dengan u (error/residual), bisa-bisa dilanggar. Jika ada variabel endogen di sisi kanan, jelas bahwa ada X yang stokastik dan ada kemungkinan berkorelasi dengan error/residual (melanggar salah satu asumsi model klasik). Di sinilah TSLS bekerja dengan segala prasyaratnya.

07 November 2008

Tips: Mengestimasi Perbedaan Rata-rata Dua Kelompok Observasi

Regresi dengan variabel dummy dapat digunakan untuk mengestimasi perbedaan variabel antar dua kelompok observasi. Misalnya kita ingin menghitung apakah upah buruh laki-laki dan perempuan yang berkerja di sebuah/beberapa perusahaan berbeda secara statistik, dan jika ya berapa besar perbedaannya (nilai rata-rata). Atau ingin mengetahui perbedaan kesejahteraan sekelompok petani dengan sekelompok lainnya. Atau mungkin juga ingin mengetahui apakah ada perbedaan produktivitas pegawai setelah diikutkan pelatihan emotional quotient misalnya. Atau ingin tahu apakah jumlah uang beredar berbeda antara sebelum dan sesudah sebuah kebijakan moneter dikeluarkan oleh BI, dan lain-lain.

Misalnya untuk membedakan upah buruh laki-laki dan perempuan di tiga perusahaan tekstil (sebagai satu kelompok observasi), dengan menggunakan model seperti:

Y = a + bD + e ................(1),

di mana Y= besar upah yg diterima masing-masing buruh, D adalah variabel dummy laki-laki dan perempuan, e adalah faktor penggangu (error term), kita secara sederhana dapat menjawab dua pertanyaan sekaligus yaitu: 1) apakah upah buruh berbeda antara laki-laki dan perempuan atau tidak dan 2) jika ya, seberapa besarkah perbedaan rata-rata upah di antara keduanya.
Untuk menghasilkan jawaban pertanyaan itu, langkah-langkah yang dilakukan adalah, 1) kumpulkan data pendapatan masing-masing buruh laki-laki dan perempuan di tiga perusahaan tekstil tersebut (tentu saja dengan syarat kecukupan data dan metode sampling yang dapat dipertanggungjawabkan), 2) susun data dalam tabel sebagai berikut:

3) estimasi data tersebut dengan menggunakan persamaan (1), dan 4) baca hasilnya, misalnya:

Y = 593000 + 25513D ............(2)

Setelah yakin bahwa hasil regresi sudah baik (BLUE), hasil regresi sudah dapat dibaca.
Jika variabel dummy hasil regresi adalah signifikan secara statistik (t hitung melebihi t kritis, misalnya dengan alfa=5%, pengujian dua sisi) berarti rata-rata upah buruh laki-laki dan perempuan di tiga perusahaan tersebut berbeda secara statistik. Rata-rata upah buruh perempuan di tiga perusahaan tekstil adalah Rp 593.000, dan upah rata-rata laki-laki lebih tinggi sebesar adalah Rp 25.513 dari perempuan, yaitu sebesar Rp 618.513. Trus, kita tinggal mencari tahu sebab-sebab perbedaan ini. Ada apa? Tinggal buruh-buruh cewek berdemonstrasi deh, menuntut upah yang sama dengan para pria. Tapi, jika variabel D tidak signifikan, berarti rata-rata upah buruh perempuan dan upah buruh laki-laki di tiga perusahaan tekstil tersebut tidak berbeda, alias sama. Bagaimana jika tanda koefisien D negatif? Itu artinya upah buruh laki-laki lebih rendah dari upah perempuan (tentu saja jika signifikan). Jadi tanda tidak menunjukkan hubungan negatif atau positif seperti regresi dengan variabel independen X.
Model regresi dengan dummy saja (tanpa ada variabel independen X) seperti ini disebut dengan model regresi anova. Tapi berbeda kan dengan uji beda rata-rata anova di satitstika?

12 September 2008

Histori: Nobel Memorial Prize 1980 untuk Lawrence R. Klein, kedua untuk Ekonometrika


Setelah lebih dari sepuluh tahun setelah Nobel Ekonomi khususnya di bidang Ekonometrika dianugerahkan kepada Tinbergen dan Frisch pada 1969, pada tahun 1980 Nobel Ekonomi dianugerahkan kembali kepada pengembang Ekonometrika, yaitu Lawrence Robert Klein dari Amerika Serikat.
Nobel Memorial Prize diberikan kepada Lawrence R. Klein (1920 - ) untuk karya ciptanya membangun model ekonometri dan aplikasinya untuk analisis fluktuasi ekonomi dan kebijakan ekonomi.

25 April 2008

Tips: Menghitung Pertumbuhan

Halo.…Sorry lama tidak muncul, berhubung ada beberapa trouble dalam mengakses blog ini. Ok, ini saya lanjutkan lagi..Masih mengenai problem-problem sederhana sehari-hari. Diskusi ini berdasarkan beberapa pertanyaan teman-teman mengenai variabel trend waktu dalam regresi. Misalnya, “bagaimana memasukkan waktu sebagai variabel independen dalam sebuah model regresi?”, “Apa manfaatnya?”, “Datanya bagaimana?”.
Banyak di antara kita yang sehari-hari memerlukan perhitungan tingkat pertumbuhan berbagai variabel ekonomi dalam penelitian kita, misalnya pertumbuhan PDB riil, pertumbuhan harga saham, pertumbuhan penduduk, dan lain-lain sepanjang periode tertentu (tahunan, kuartalan, bulanan, mingguan, harian, dll). Untuk kebutuhan itu, secara ringkas, dapat digunakan model semilog, seperti berikut:

LnPDBt = β0 + β1T + ut

Variabel dependen (PDB=produk domestik bruto) di-logaritma-natural-kan, variabel independennya adalah T, yaitu trend waktu. Data untuk variabel T adalah 1, 2, 3 dan seterusnya. Faktor kesalahan (error) ditunjukkan dengan ut, Dalam model ini, koefisien kemiringan (slope) mengukur perubahan relatif dari PDB berdasarkan perubahan nilai absolut variabel independenT.
Dengan mengalikan perubahan relatif variabel dependen (PDB) dengan 100, akan memberikan perubahan persentase, atau tingkat pertumbuhan variabel dependen untuk perubahan absolut pada variabel independen.
Misalnya dengan contoh hipotetis, observasi adalah yang digunakan kuartalan 1990.1-2006.4. Hasil regresi ditunjukkan sebagai berikut:

LnPDBt = 8,732 + 0,00982T

Interpretasi persamaan tersebut adalah, sepanjang periode 1990.1-2006.4, PDB tumbuh secara kuartalan pada tingkat 0,982 persen.

25 Januari 2008

Diskusi: Standardized Variables vs Unstandardized Variables

Diskusi ini saya ambil berdasarkan email di milis multivariate_SEM@yahoogroups.com yang diasuh Prof. Imam Ghozali. Biar yang lain juga bisa baca dari sumber ini, saya muatkan di sini dengan sedikit penyesuaian. Dan tentu saja diskusi yang saya angkat ini yang saya juga terlibat dalam menjawab email tersebut.
Pertanyaannya (dari bung Utomo – dapat dilihat di milis) sbb:
1. Bagaimana konsekuensinya jika yang dibaca adalah unstandardized coefficient, secara statistik/ekonometri?
2. Bagaimana konsekuensinya jika yang dibaca adalah standardized coefficient, secara statistik/ekonometri?
3. Apakah ada ketentuan untuk memilih penggunaannya?

Bagian dari diskusi milis dari saya:
Jika yang dimaksud standardized coef adalah beta coef (bukan koefisien beta di teori keuangan), berarti itu adalah koefisien parameter regresi dari standardized variables. Standardized variables adalah variabel-variabel yang datanya telah distandardisasi dengan standar deviasi masing-masing variabel, baik variabel dependen maupun variabel-variabel independennya.
Jadi, output regresi yang dihasilkan software tertentu (misalnya SPSS), beta coefficient/ standardized coefficient, dihasilkan melalui proses tersebut. Kalau yang unstandardized coef, berarti regresi dihasilkan dengan menggunakan variabel biasa (tidak distandardisasi), tetap menggunakan unit skala dan ukuran aslinya.
Bisa jadi kita melakukan regresi dengan standardized variable adalah untuk mendapatkan koefisien yang memiliki basis unit yang sama, sehingga (dalam multiple regression) kita dapat membandingkan secara langsung antar variabel indenpenden, dalam pengaruhnya masing-masing terhadap variabel dependen. Variabel dependen mana yang berpengaruh lebih besar terhadap variabel dependen dapat dilihat dari besar kecilnya masing-masing koefisien (beta) regressor.
Namun, ada beberapa hal yang perlu dicatat jika menggunakan beta coefficient. Pertama, model regresi kita merupakan regression trough the origin alias tidak lagi memiliki intersep. Untuk ukuran goodness of fit, kita tidak dapat lagi menggunakan R square biasa. Kedua, interpretasi koefisien (beta) jadi sulit, karena kita harus selalu mengkaitkannya dengan standar deviasi variabel.
*Tentu saja (jika besaran koefisien regresi dapat diinterpretasi) , unstandardized coef lebih baik dan mudah untuk dibaca, di samping itu dengan unstandardized variable, R square biasa dapat dipergunakan.*Keunggulan standardized coef (beta) adalah dapat membandingkan pengaruh variabel independen (seperti saya diskusikan di atas). Keunggulan ini juga dapat dihasilkan dengan regresi menggunakan variabel yang di-logaritma (natural)-kan, dengan kondisi tertentu.
Jadi silahkan dipilih mana yang akan digunakan. Juga sebenarnya standardized variable tidak tergantung skala atau unit pengukuran data lho.

14 November 2007

Catatan: Mengapa Faktor Error Ada Dalam Regresi?

Penyisipan faktor error (mis: u) ke dalam fungsi disebabkan oleh berbagai alasan, yaitu:

  • Penyisipan faktor u dalam model mewakili himpunan pengaruh dari seluruh variabel-variabel yang diabaikan (peripheral variable). Dimungkinkan pengaruh semua variabel tersebut sangat kecil.
  • Memasukkan faktor u digunakan untuk mewakili kesalahan-kesalahan dalam pengukuran, pencatatan, pengumpulan maupun pengolahan data.
  • Karena ketidaksempurnaan spesifikasi bentuk matematis model. Bentuk linier dari persamaan regresi hanyalah sebagai pendekatan dari bentuk persamaan yang sebenarnya. Faktor u antara lain termasuk pula sebagai faktor koreksi akibat kesalahan karena pendekatan linier semacam ini.
  • Perilaku acak dalam kehidupan. Perilaku manusia adalah keadaan acak yang tidak dapat diduga/dipastikan.Variabel-variabel yang sering digunakan dalam regresi berganda sering merupakan agregat dari variabel-variabel lainnya. Agregasi dapat berupa ruang, waktu dan sebagainya. Dengan agregasi sebenarnya telah dibuang berbagai informasi yang ada pada berbagai distribusi di antara pengamatan-pengamatan individual. Kehilangan informasi ini mungkin dapat meningkatkan error dalam hubungannya dengan masalah agregasi.

01 November 2007

Catatan: Manfaat pendekatan ekonometri

1. Verifikasi
Sebagai alat untuk membuktikan atau menguji validitas teori-teori ekonomi. Tidak ada satupun teori yang dapat mempertahankan kehebatannya tanpa melalui pengujian empiris, dan ekonometri membantu melakukan pengujian empiris.
2. Penaksiran
Untuk menghasilkan taksiran-taksiran koefisien-koefisien hubungan ekonomi. Taksiran-taksiran ini sangat bermanfaat bagi pengambilan keputusan.
3. Peramalan
Meramalkan nilai besaran-besaran ekonomi yang akan datang.

30 Oktober 2007

Tips: Menyamakan Periode Dasar Data

Seringkali penelitian yang mengamati perkembangan data secara deskriptif atau yang menggunakan model ekonometri, variabel penelitian memiliki data dalam bentuk angka indeks. Jika dua seri atau lebih data angka indeks tersebut memiliki periode dasar yang sama, maka seri-seri tersebut dapat diperbandingkan secara langsung. Namun, jika dua seri data tersebut memiliki periode dasar yang tidak sama, maka angka-angka tersebut tidak dapat diperbandingkan secara langsung.
Perbedaan tahun dasar biasanya disebabkan oleh kebutuhan tertentu untuk mengakomodasi informasi baru. Misalnya BPS mengeluarkan data IHK (Indeks Harga Konsumen) selama periode 1983-1995 dengan tahun dasar 1983 = 100, lalu mempublikasikan data IHK tahun 1993-2000 dengan tahun dasar 1993 = 100.
Langkah-langkah menyamakan tahun dasar:
1) Cari satu data/angka yang dihitung dengan menggunakan dua tahun dasar, misalnya data pada tahun 1992 diukur dengan tahun dasar 1983 dan 1993
2) Setelah itu jika kita ingin menjadikan semua data bertahun dasar 1993, dapatkan sebuah magic number, yaitu data tahun 1992 menurut tahun dasar 1993 dibagi dengan data tahun 1992 menurut tahun dasar 1983.
3) Angka hasil pembagian tersebut (magic number) dikalikan dengan semua data yang diukur menurut tahun dasar 1983 dan data tersebut menjadi bertahun dasar 1993.
4) Tetapi jika kita ingin menjadikan semua data bertahun dasar 1983, maka untuk mendapatkan magic number data tahun 1992 menurut tahun dasar 1993 dibagi dengan data tahun 1992 menurut tahun dasar 1983
5)Kemudian semua data tahun 1993 dibagi dengan magic number tersebut, agar semua data bertahun dasar 1993 menjadi data bertahun dasar 1983.

05 Oktober 2007

Artikel: Model Regresi Panel Data

Data panel atau panel data adalah gabungan dari data time series (antar waktu) dan data cross section (antar individu/ruang). Untuk menggambarkan panel data secara singkat, misalkan pada data cross section, nilai dari satu variabel atau lebih dikumpulkan untuk beberapa unit sampel pada suatu waktu waktu. Dalam panel data, unit cross section yang sama di-survey dalam beberapa waktu (Gujarati, 2003:637).
Regresi dengan menggunakan panel data, memberikan beberapa keunggulan dibandingkan dengan pendekatan standar cross section dan time series.

Keunggulan dan Permasalahan Regresi dengan Data Panel
Hsiao (1986), mencatat bahwa penggunaan panel data dalam penelitian ekonomi memiliki beberapa keuntungan utama dibandingkan data jenis cross section maupun time series.
Pertama, dapat memberikan peneliti jumlah pengamatan yang besar, meningkatkan degree of freedom (derajat kebebasan), data memiliki variabilitas yang besar dan mengurangi kolinieritas antara variabel penjelas, di mana dapat menghasilkan estimasi ekonometri yang efisien.
Kedua, panel data dapat memberikan informasi lebih banyak yang tidak dapat diberikan hanya oleh data cross section atau time series saja.
Ketiga, panel data dapat memberikan penyelesaian yang lebih baik dalam inferensi perubahan dinamis dibandingkan data cross section.

Di samping berbagai keunggulan dimiliki model panel data tersebut, ada beberapa permasalahan yang muncul dalam pemanfaatan data jenis panel, yaitu permasalahan autokorelasi dan heterokedastisitas. Sementara itu ada permasalahan baru yang muncul seperti korelasi silang (cross-correlation) antar unit individu pada periode yang sama.

Estimasi Regresi dengan Data Panel
Estimasi model panel data tergantung kepada asumsi yang dibuat peneliti terhadap intersep/konstanta (intercept), koefisien kemiringan (slope coefficients) dan variabel error (error term). Model-model estimasi ini akan ditinjau pada kesempatan lain.

02 Oktober 2007

Histori: Hadiah Nobel Pertama Ilmu Ekonomi untuk Ekonometrika





Pertama sekali Nobel Memorial Prize diberikan pada Ilmu Ekonomi pada tahun 1969, hadiah tersebut dianugerahkan kepada Ragnar Frisch (1895-1973)dari Norwegia, dan Jan Tinbergen (1903-1994) dari Belanda untuk karya pionir mereka dalam bidang Ilmu Ekonometri.





Selamat Datang!

Selamat datang di blog “Belajar Ekonometrika & Statistika Ekonomi”.