25 Januari 2008

Diskusi: Standardized Variables vs Unstandardized Variables

Diskusi ini saya ambil berdasarkan email di milis multivariate_SEM@yahoogroups.com yang diasuh Prof. Imam Ghozali. Biar yang lain juga bisa baca dari sumber ini, saya muatkan di sini dengan sedikit penyesuaian. Dan tentu saja diskusi yang saya angkat ini yang saya juga terlibat dalam menjawab email tersebut.
Pertanyaannya (dari bung Utomo – dapat dilihat di milis) sbb:
1. Bagaimana konsekuensinya jika yang dibaca adalah unstandardized coefficient, secara statistik/ekonometri?
2. Bagaimana konsekuensinya jika yang dibaca adalah standardized coefficient, secara statistik/ekonometri?
3. Apakah ada ketentuan untuk memilih penggunaannya?

Bagian dari diskusi milis dari saya:
Jika yang dimaksud standardized coef adalah beta coef (bukan koefisien beta di teori keuangan), berarti itu adalah koefisien parameter regresi dari standardized variables. Standardized variables adalah variabel-variabel yang datanya telah distandardisasi dengan standar deviasi masing-masing variabel, baik variabel dependen maupun variabel-variabel independennya.
Jadi, output regresi yang dihasilkan software tertentu (misalnya SPSS), beta coefficient/ standardized coefficient, dihasilkan melalui proses tersebut. Kalau yang unstandardized coef, berarti regresi dihasilkan dengan menggunakan variabel biasa (tidak distandardisasi), tetap menggunakan unit skala dan ukuran aslinya.
Bisa jadi kita melakukan regresi dengan standardized variable adalah untuk mendapatkan koefisien yang memiliki basis unit yang sama, sehingga (dalam multiple regression) kita dapat membandingkan secara langsung antar variabel indenpenden, dalam pengaruhnya masing-masing terhadap variabel dependen. Variabel dependen mana yang berpengaruh lebih besar terhadap variabel dependen dapat dilihat dari besar kecilnya masing-masing koefisien (beta) regressor.
Namun, ada beberapa hal yang perlu dicatat jika menggunakan beta coefficient. Pertama, model regresi kita merupakan regression trough the origin alias tidak lagi memiliki intersep. Untuk ukuran goodness of fit, kita tidak dapat lagi menggunakan R square biasa. Kedua, interpretasi koefisien (beta) jadi sulit, karena kita harus selalu mengkaitkannya dengan standar deviasi variabel.
*Tentu saja (jika besaran koefisien regresi dapat diinterpretasi) , unstandardized coef lebih baik dan mudah untuk dibaca, di samping itu dengan unstandardized variable, R square biasa dapat dipergunakan.*Keunggulan standardized coef (beta) adalah dapat membandingkan pengaruh variabel independen (seperti saya diskusikan di atas). Keunggulan ini juga dapat dihasilkan dengan regresi menggunakan variabel yang di-logaritma (natural)-kan, dengan kondisi tertentu.
Jadi silahkan dipilih mana yang akan digunakan. Juga sebenarnya standardized variable tidak tergantung skala atau unit pengukuran data lho.

25 komentar:

  1. Apa alasannya ukuran goodness of fit pada standardized variables, tidak dapat lagi menggunakan R square biasa. Apa maksud dari R square biasa? R square yang tidak biasa itu seperti apa? Kalau sofrware seperti SPSS menyajikan keduanya (dengan permintaan kita tentunya), apakah itu bukan berarti bahwa R square tersebut berlaku juga untuk versi standardizednya?Sebagai catatan,regresi terhadap nilai standardized akan memberikan nilai R square yang sama dengan data nonstandardizednya.Silahkan mencobanya.

    BalasHapus
  2. to Mr Je
    melihat blognya Pak Je, rasanya pertanyaan ini tentu sudah terjawab...he..he..he... mungkin cuman mau nguji saya nih. Coba saya jawab ya...mudah-mudahan kena di hati...juga buat teman-teman lain yang juga ikut baca...
    Sebelumnya maaf banget nih karena terlambat. Karena ada pelatihan dll, blog jadi terbengkalai...
    Dalam menggunakan regresi dengan variabel standardized, konstanta akan hilang dari persamaan. Kenapa hilang? Proses pembentukan variabel standardized akan menghilangkan konstanta dari persamaan.
    Sekarang persamaan menjadi persamaan yang tanpa konstanta (melalui titik origin). Hasil ini ditampilkan di output SPSS dengan konstanta yang tidak ada angkanya.
    Karena regresi sekarang adalah regresi tanpa konstanta, maka R square yang “biasa” kita gunakan pada regresi dengan konstanta tidak dianjurkan untuk digunakan lagi. Hal ini karena rumus R square “biasa” secara tegas mengasumsikan bahwa model tersebut memiliki konstanta dalam perhitungannya.
    Wah, asalnya rumus R square ini kalau ditulis, akan cukup panjang lebar, jadi bisa dicermati lagi di buku2 statistik dan ekonometri. (Untuk topik R square ini, saya secara khusus sedang menuliskan untuk artikel yad di blog ini).
    Untuk ukuran goodness of fit model regresi tanpa konstanta, Gujarati and Porter (2009), menganjurkan menggunakan raw R square, dengan formula (untuk regresi sederhana):

    Raw r square = ((ΣXiYi)^2) / ((Σxi^2)(ΣYi^2))

    Jika SPSS bisa mengeluarkan R square khusus untuk regresi dengan model non intercept saya malah belum tahu. Selain saya tidak biasa menggunakan SPSS, dan biasanya output-output perhitungan yang diset otomatis oleh software tetap akan menghasilkan perhitungan standarnya. Jadi R square tetap akan keluar angkanya. Karena pada output nilai koefisien mengeluarkan standardized dan unstandardized coef, saya curiga itu R square regresi yang menggunakan konstanta. Coba saja dicek di fasilitas Hekp-nya.

    BalasHapus
  3. Ha..ha..ha..Sama sekali bukan pertanyaan untuk nguji. Saya bukan orang statistik. Saya cuma orang yang mengenal banyak prosedur statistik dan juga alat hitungnya (SPSS dll). Pengetahuan saya mungkin saja luas tapi tidak begitu mendalam soal statistik yang sudah saya kenal itu.
    Terimakasih atas jawabannya. Saya sangat menghargainya. Tapi jujur saja belum kena dihati neh he..he..he..Masalahnya, dalam praktek yang selama ini saya lakukan, saya menggunakan koefisien regresi standardized hanya untuk keperluan mencari mana diantara semua variabel independen yang paling dominan pengaruhnya terhadap dependen. Dan bila orang menanyakan pengaruh simultan semua variabel independen, maka saya hanya melaporkan R^2 "biasa" (unadjusted ataupun adjusted) disertai uji F uji signifikansi pengaruh simultannya. Berarti selama ini buanyak yang salah ya termasuk saya tentu saja. Sebagai contoh dalam path analysis, dalam literatur statistik dan jurnal-jurnal penelitian yang saya baca, koefisien regresi yang dilaporkan adalah koefisien beta (standardized) demikian juga dalam SEM. Untuk R^2 mereka dan termasuk saya hanya melaporkan apa yang disajikan oleh output software statistik, tanpa repot-repot terlebih dahulu menstandardized variabel kemudian mengestimasi regression throught the origin untuk memperoleh R^2-nya.
    Maaf kepanjangan. Terimakasih sebelumnya.

    Salam

    Je

    BalasHapus
  4. Ok Mr Je,
    Orang memang menggunakan koefisien standardized untuk membandingkan besar pengaruh masing-masing variabel independen terhadap dependen, sehingga diketahui variabel independen mana yang memiliki pengaruh paling besar terhadap variabel dependen.
    Jika ingin menginterpretasi koefisien, orang akan menggunakan koefisien unstandardized. Tidak salah jika R square yang dibaca kemudian adalah R square pada regresi yang menggunakan variabel unstandardized. Tapi seringkali kita lupa, kita membaca R square pada regresi dengan variabel standardized (baca: tidak peduli or tidak tahu?). Dicampuradukkan.
    Penekanan penggunaan Raw R quare adalah pada regresi tanpa konstanta, dan regresi dengan variabel standardized adalah regresi tanpa konstanta.

    Salam jg.

    BalasHapus
  5. .....saya juga bukan orang statistik lho pak Je....kebetulan aja ilmu ekonomi menggunakan ekonometri sebagai alat analisis utama (dalam pendekatan kuantitatifnya.....)
    moga-moga komennya bermanfaat.....

    BalasHapus
  6. bapak2,, maaf saya mau nanya seputar regresi yg tidak memakai intercept. saya lagi nyusun skripsi, dan kebetulan untuk pertama kalinya pakai spss untuk meregresi persamaan non-intercept.

    membaca percakapan sebelumnya, jadi bisa saya simpulkan, ketika kita punya persamaan tanpa intercept, nilai R2 tidak lagi harus diacuhkan karena tidak ada hubungannya?

    saya memiliki persamaan regresi tanpa intercept. setelah dirun dgn spss, hasilnya buruk sekali : R2 kecil, var.independen tdk ada yg signifikan, dan F juga menunjukkan Ho diterima. tapi sbnrnya saya bingung dgn tujuan persamaan regresi tanpa intercept, apakah tetap harus memperhatikan signifikansi var.independen, nilai R2 yg besar, dan F yang menolak H0?

    trimakasih sblmnya.. :)

    BalasHapus
  7. to aphelium...
    seharusnya sewaktu menspesifikasikan model kita mengetahui alasan model regresi kita memiliki intersep atau tidak....
    model tanpa intersep dalam permodelan ekonomi, dapat disebabkan oleh teori ekonomi sendiri lho...contoh dalam ilmu manajemen, model CAPM...atau model2 jangka panjang lain dalam teori2 moneter...
    teori ini menjadi dasar utama dalam menspesifikasi model...
    Jika interssep hilang akibat variabel di-"standardized" spt diskusi di atas, maka R2 "biasa" tidak lagi digunakan, tapi dapat menggunakan salah satunya raw R2 (lht diskusi sblmnya).
    Untuk signifikansi pengaruh individu variabel dependen (uji t) dan uji F (yg semuanya tidak signifikan), dapat disebabkan oleh banyak hal, salah satunya spesifikasi model yang tidak tepat...atau, permasalahan pada data...
    so, itu semua harus diperbaiki dulu
    ....

    Ok, good luck....

    BalasHapus
  8. Nidya_FE.
    Cara meregresi standardize varibel dgn SPSS bgaimana crnya??
    Saya ada tugas ttg path analysis. Nah, dalam proses pnghitungannya ada meregresi standardize variabel2..
    Tolong ya..
    Trima kasih..

    BalasHapus
  9. cara hitung manual standardized coeffiecient bagaimana y ..?

    BalasHapus
  10. Malam Pak..saya sedang mengerjakan skipsi saya,memasuki Bab IV sewaktu akan melakukan uji t,ternyata N saya berjumlah 400,sedangkan tabel yang saya temukan dibuku Pak Imam Ghozali hanya sampai 300..dimana bisa dapetin tabel yang N-nya sampai 40 ya pak?
    Terima kasih sebelumnya ya Pak..

    BalasHapus
  11. hasil analisis menunjukkan bahwa nilai koefisien regresi untuk variabel masa kerja (X1) bernilai positif yakni adalah sebesar 0,264, Hal ini berarti jika variabel masa kerja ini ditingkatkan maka efektivitas kerja (Y) akan mengalami peningkatan dengan koefisien regresi sebesar 0,264. mohon masukannya mengenai penjelasan pernyataan ini. trims

    BalasHapus
  12. Permisi pak bagaimana kalau nilai y= a 102.75 + - 0.131 pak? nilai kolerasinya minus pak?saya tidak paham?

    BalasHapus
    Balasan
    1. ini juga saya alami dalam model regresi ganda. salah satu variabel independennya pada perhitungan standardized coefficients (Beta) ada nilai (-). itu apa artinya ya pak? mohon jawabannya. Trima kasih

      Hapus
  13. Permisi pak,apa tujuan penggunaan unstandardized dalam penelitian??

    BalasHapus
  14. Permisi pak,apa tujuan penggunaan unstandardized dalam penelitian??

    BalasHapus
  15. maaff pak,, saya mau naya dalam regresi termediasi kan yang dilihat menggunakan nilai beta di unstandrlized,, alasan nya apa yahh pak,, makasih sblumny.

    BalasHapus
  16. malam bapak2 semua,
    sudi kiranya dapat membantu saya ...saya tidak mengerti statistik,
    saya sedang melakukan tesis, dmana proposal saya selalu direject, menurut doping saya...
    permasalahn nya ada pada model regresi saya...
    variabel Y saya memiliki satuan Rp...
    seadngkan 12 variabel X saya memiliki satuan yg berbeda beda...
    jadi, seperti kata doping saya, jika Y saya Rp... maka satuan X saya harus Rp. juga
    masalahnya bagaimana saya bisa mengkonversi 12 variabel dengan satuan yg berbeda ke satuan Rp..
    contoh
    x1 = luas tanah
    x2 = lebar jalan
    x3 = jarak ke jalan utama
    x4 = jarak ke CBD

    D1 = bentuk tanah
    D2 = letak tanah
    D3 = jenis sertifikat
    D4 = etnis
    ........DST........

    pertanyaan saya
    - apakah harus semua satuan variabel sama, sedangkan dari literatur yg saya peroleh tidak berbeda jauh dari model saya
    - jika seandainya dinyatakan boleh berbeda satuan sudi kiranya bapak2 memberikan kepada saya buku atau pernyataan yg bisa saya gunakan untuk mempertahan kan argumen saya
    - saya pernah membaca sekilah artikel, dikatakan dlm artikel tsb jika memiliki banyak satuan variabel maka pakailah standrlized Beta....apakah itu benar, jika benar adakah buku yg menyatakan itu agar bisa menjadi pegangan saya

    sebelumnya saya mengucapkan terima kasih untuk bantuannyya..

    BalasHapus
  17. pak saya mau tanya kalau dalam tabel coefficient, kolom unstandardized coefficient pada kolom B , nilai -nilai variabelnya diantaranya ada huruf E nya ditengah2 angka,contohnya 9,63E-009 itu maksudnya apa ya ?
    mohon penjelasannya karena saya bingung menjelaskan interpretasinya

    BalasHapus
    Balasan
    1. sya mau tanya..solusi utk output spss yg seperti ini bagaimana ?

      Hapus
  18. Maaf kaka"
    Perbedaan unstandardized dg standardized itu apa yah

    BalasHapus
  19. sya mau tanya bagaimana solusi utk output spss yg keluar huruf E

    BalasHapus
  20. Siang pak, ada yg mau saya tanyakan
    Hasil output spss saya pada kolom unstandardize coefficients B yaitu
    nilai constan : -251,181. X1 : 393,030. X2 : 291,602. X3: -169,269. Kenapa hasil output saya bisa sebesar ini ya pak? Padahal data saya lulus uji asumsi klasik. Data yg saya pakai adalah laporan keuangan di idx.

    BalasHapus
  21. pak saya mau tanya, nilai konstanta sy hasilnya minus di unstandardized Beta..jadi kalo saya menggunakan standardized Beta dia tidak memiliki konstanta apakah itu boleh pak?
    alasannya kenapa

    BalasHapus
  22. Pak/mas izin bertanya yang dimaksud r square dan nilai konstanta itu apa ya?
    Trs perbedaan unstandarized coefficient sma standard coefficient apa? Mohon pencerahannya🙏🏼

    BalasHapus