Saturday, March 10, 2012

Analisis Regresi dengan Menggunakan Data Panel



Dalam melakukan Analisis Ekonometrika khususnya regresi, terdapat 3 jenis data yang dapat digunakan, yaitu: data time-series, data cross-section, dan data panel. Pada data time series, satu atau lebih variabel akan diamati pada satu unit observasi dalam kurun waktu tertentu. Sedangkan data cross-section merupakan amatan dari beberapa unit observasi dalam satu titik waktu. Perlu ditekankan, Tiap jenis data punya kegunaan dan konsekuensi dari penggunaan data yang berbeda satu sama lain.

Nah, data panel (panel pooled data) sendiri merupakan gabungan data cross section dan series. Dengan kata lain, data panel merupakan data dari beberapa individu sama yang diamati dalam kurun waktu tertentu. Jika kita memiliki T periode waktu (t = 1,2,...,T) dan N jumlah individu (i = 1,2,...,N), maka dengan data panel kita akan memiliki total unit observasi sebanyak NT. Jika jumlah unit waktu sama untuk setiap individu, maka data disebut balanced panel. Jika sebaliknya, yakni jumlah unit waktu berbeda untuk setiap individu, maka disebut unbalanced panel.

Menurut Baltagi (2005) dalam Fadly (2011), penggunaan data panel dalam regresi memiliki beberapa keuntungan, diantaranya :

1.                           Dengan menggabungkan data time series dan cross section, panel menyediakan data yang lebih banyak dan informasi yang lebih lengkap serta bervariasi. Dengan demikian akan dihasilkan degress of freedom (derajat bebas) yang lebih besar dan mampu meningkatkan presisi dari estimasi yang dilakukan.

2.                           Data panel mampu mengakomodasi tingkat heterogenitas individu-individu yang tidak diobservasi namun dapat mempengaruhi hasil dari permodelan (individual heterogeneity). Hal ini tidak dapat dilakukan oleh studi time series maupun cross section sehingga dapat menyebabkan hasil yang diperoleh melalui kedua studi ini akan menjadi bias.

3.                           Data panel dapat digunakan untuk mempelajari kedinamisan data. Artinya dapat digunakan untuk memperoleh informasi bagaimana kondisi individu-individu pada waktu tertentu dibandingkan pada kondisinya pada waktu yang lainnya.

4.                           Data panel dapat mengidentifikasikan dan mengukur efek yang tidak dapat ditangkap oleh data cross section murni maupun data time series murni.

5.                           Data panel memungkinkan untuk membangun dan menguji model yang bersifat lebih rumit dibandingkan data cross section murni maupun data time series murni.

6.                           Data panel dapat meminimalkan bias yang dihasilkan oleh agregasi individu karena unit observasi terlalu banyak.



Regresi data panel dapat dimodelkan sebagai berikut :


Dimana:

α       = Konstanta

β       = Vektor berukuran P x 1 merupakan parameter hasil estimasi

Xit    = Observasi ke-it dari P variabel bebas

αi      = efek individu yang berbeda-beda untuk setiap individu ke-i

Eit     = error regresi seperti halnya pada model regresi klasik.



Model persamaan diatas disebut one-way model atau model satu arah, karena hanya mempertimbangkan efek individu (αi) dalam model. Jika model juga mempertimbangkan efek dari waktu atau memasukka variabel waktu, maka disebut two-way model atau model dua arah dan secara matematis dapat dituliskan sebagai berikut:
Dimana terdapat tambahan efek waktu yang dilambangkan dengan deltha yang dapat bersifat tetap ataupun bersifat acak antar tahunnya, selain dari keterangan yang sudah dijelskan sebelumnya.

Seperti halnya Regresi dengan menggunakan data Cross section, Regresi dengan menggunakan data panel pun memiliki tahapan yang pada dasarnya sama dengan yang sudah saya posting sebelumnya. Yaitu: Eksplorasi, Identifikasi, Estimasi, Pengujian signifikansi, Uji asumsi dan Goodness of fit model.

Namun, dengan menggunakan data panel, konsekuensinya adalah selain harus melewati tahapan tersebut, sebagai pembuat model kita harus juga melalui tahapan yang dapat dijelaskan oleh Gambar 1 berikut.

Gambar 1. Tahapan Regresi menggunakan Data Panel (Slide powerpoint Fadly, 2011)








Tahapan yang harus dilalui:

1.      Penentuan Model Estimasi – Terkait dengan model yang digunakan, Fixed or Random Effects?

2.      Penentuan Metode Estimasi

3.      Pengujian Asumsi dan Kesesuaian Model

4.      Interpretasi



41 comments:

felani hayati said...
This comment has been removed by the author.
felani hayati said...

selamat siang Mas, saya felani. saya lagi nyusun skripsi dan data saya memenuhi kriteria sebagai data panel, yaitu tahun pengematan saya 2006-2011 dan perusahaan-perusahaan yg terdaftar di BEI (jumlah sampel nya belum pasti).

yang ingin saya tanyakan, kalau misalnya saya tidak menggunkan analisis regeresi data panel tapi tetap menggunakan analisis regresi biasanya, apakah bisa Mas? apakah nanti akan ada masalah untuk hasilnya?

terimakasih..

Ferdian Fadly said...

kalau menurut saya, hasilnya ada pengaruh atau tidaknya dapat dilihat pada pengujian signifikansi fixed versus common effect nya...apakah memang variabel tersebut berkorelasi dengan individu nya atau masing-masing individu memiliki efek --> Fixed Effect Model atau tidak memiliki --> common model...nah, model common inilah regresi biasa yang kita lakukan itu...^_^...

tetapi kalau untuk skripsi, fokusnya saat ini itu bukan pada hal yang serumit ini, seperti panel atau bagaimana..., yang paling terpenting dari skripsi adalah mahasiswa itu mampu berpikir sistematis dalam menyelesaikan suatu permasalahan...jadi kalau pada skripsi, kalaupun penelitian ini memang mau diselesaikan dengan analisis regresi biasa ya menurut saya SAH-SAH saja, walaupun itu memang seharusnya kurang tepat...mungkin bisa juga disolusikan dengan 2 opsi berikut :

- Gunakan dummy variabel untuk melihat efek waktu ataupun efek individu nya

- Kalau pada satu tahun sampel nya sudah cukup banyak, mungkin ada lebih dari 50 perusahaan atau 30 perusahaan (ini relative ya)... satu tahun saja menurut saya sudah cukup --> apabila memang tidak mau terjebak dengan namanya data panel.

felani hayati said...

Selamat siang Mas..

terimakasih atas jawaban sebelumnya :)

tapi saya kurang mengerti dengan solusi kedua yang Mas Kasih. Kenapa periode waktunya bisa dikurangi spt itu? karena dalam penelitian saya, saya memang ingin melihat pengaruh dari var x thd var y selama 6 tahun dengan perusahaan yg sama setiap tahunnya. jadi untuk tahun 1,2,..6 sampel yg ditelitinya sama, banyak sampelnya pun sama.

trus saya ada pertanyaan lagi Mas, hehe..
untuk pengambilan sampel saya ingim memakai simple random sampling, tapi saya juga memiliki kriteria2 tertentu juga yg harus dipenuhi oleh sampel. nah apakah saya bisa menggunakan simple random sampling (misalnya didapat 100 perusahaan), dari 100 perusahaan tsb saya terapkan purposive sampling agar sample yg didapat memenuhi kriteria saya?

terimakasih..

Ferdian Fadly said...

Maksud saya itu, kenapa tidak fokus pada satu tahun tertentu saja, pada tahun 2011...apabila memang sampelnya mencukupi.

tentukan populasi targetnya saja dulu --> populasi target itu populasi yang sudah sesuai dengan kriteria yang kita tetapkan...baru kemudian diambil sampel dari populasi target yang sesuai kriteria....

die_raa said...

wah..udah lama gak bertemu dg panel data dan eviews...jd agak lupa...makasi buat sharing ilmunya...

Ferdian Fadly said...

Sama-sama mbak die_raa....kalau mbak mau sharing ilmunya disini juga boleh...

putra adit said...

malam mas aq bru penelitian tth pengaruh gdp inflasi terhadap suku bunga bank, tahun yg diambil 2006-2007 padagal angka inflasi dan gdp dalam satu tahun ambil contoh 2006 nilanya X dan Y akan diuji pada suku bunga kredit perbankkan yang ada 27 bank dalam 2006 tersebut padkah itu menggunakan data panel juga terimakasih

Etania Ranu said...

lagi pengen refreshing ttd data panel (krn mmg kaji itu ngga lancar klo ga diulang2)...eh,nemu blog ini..:) tetep nulis ya ferdi..kayaknya yg data panel blm slese bkn sih postingannya?
*pnasaran* *critanya ini komik* *eh tp bneran loh!*

Ferdian Fadly said...

@kak Eta : Hehehe...tau aja kak...^_^...iya...manajemen waktunya masih kacau...InsyaAllah kalau sudah mulai tenang, mulai nulis lagi... Makasih ya kakanda sudah membaca...^_^

Anonymous said...

Mas ferdi,,, bisa bantu interpretasi data gak..? datanya udah aku olah pake data panel common effect, tapi aku terkendala interpretasinya...

Ferdian Fadly said...

Common effect tidak mempertimbangkan adanya efek individu yg terjadi...diskusi boleh aja mas...apa modelnya?

Anonymous said...

Assalamualaikum...
Kak...sy mau bertanya...apakah untuk data panel ada batas minimal observasi? misalnya sy inging menganalisis provinsi dengan kab/kota=5, dan mengambil kurun waktu=4, karena kalo tidak salah ada aturan sebaiknya i>t..jadi unit observasinya cuma 20 kak, apa masih bisa menggunakan regresi data panel?
terima kasih sebelumnya kak..

aruantina said...

bang fadly, saya mau tanya kalau pengujian data panel dengan menggunakan analisis data panel memang harus memakai dummy variabel kah?? Mengapa??
kemudian jika analisis dengan salah satu antara FEM atau REM, boleh kah diuji kembali dengan path analisis?
atau manakah analisis yang lebih baik untuk data panel, apakah analisis panel atau path analisis??

Ferdian Fadly said...

@anonymous : Dahulunya, ketika saya diajarkan analisis data panel ini setelah saya diajarkan analisis time series. Time series, itu membutuhkan data kurun waktu yang cukup panjang (ada yang bilang 30 atau 50) padahal tu data susah kan dapatnya. Oleh karena itu, kemudian saya beralih ke data panel sehingga jumlah observasi 30 atau 50 itu masih bisa juga saya capai, logically. Trims...

@aruantina : kelebihan pengolahan data panel dibandingkan data time series ataupun data cross section adalah dapat melihat efek individu ataupun efek periode yang kiranya bisa mempengaruhi model. Efeknya tersebut tercermin dari dummy dummy yang tercipta pada saat kita membangun model.

Bisa kah menggunakan jalur?Mmmm...pernah dengar model persamaan simultan? Kalau belum, bisa dengan melihat tulisan saya http://ferdifadly.blogspot.com/2012/01/peran-intervensi-pemerintah.html itu skripsi saya semoga dapat membantu menjelaskan mengenai model persamaan simultan dengan menggunakan data panel.

Manakah yang lebih baik??? Single model (regresi) dengan simultaneous equation model (model persamaan simultan) itu beda dunia dan jelas beda tujuan mbak...

Terimakasih.

Anisa Fahmi said...

Mas ferdi,klo analisis sy menggunakan data panel dg time series 2002-2011 tp ada 1 variabel yg datany baru trsedia thn 2005, apa saya msh bs menggunakan unbalanced panel? (jd ad 1 variabel yang slm 3 thn datanya kosong untuk seluruh individu). Untuk diketahui banyakny time series yg sy analisa min 10 thn. Atau ada trik lain untuk mengatasi masalah ini tanpa menghilangkan variabel yg datanya kurang tsb?
Mohon pencerahanny y mas.. Makasih..

eka yudha p said...

malam mas, saya sedang skripsi, skripsi saya tentang pengaruh pertumbuhan ekonomi, investasi, dan jumlah penduduk. tahun yang di ambil tahun 2006-2010. data yang saya gunakan data dari masing2 kabupaten/kota yang di provinsi banten. mas cara penginputan data ke eviews bagaimana?

Anonymous said...

Asslamualaikum,,
Klo mau download eviews dimana ya?
n apa bia mengolah data panel dengan SPSS?
terima kasih

Ferdian Fadly said...

@Mbak anisa : Mas ferdi,klo analisis sy menggunakan data panel dg time series 2002-2011 tp ada 1 variabel yg datany baru trsedia thn 2005, apa saya msh bs menggunakan unbalanced panel? (jd ad 1 variabel yang slm 3 thn datanya kosong untuk seluruh individu). Untuk diketahui banyakny time series yg sy analisa min 10 thn. Atau ada trik lain untuk mengatasi masalah ini tanpa menghilangkan variabel yg datanya kurang tsb?
Mohon pencerahanny y mas.. Makasih..

Jawab : Berapa jumlah Individunya? ini keputusan trade off yang cukup sulit. tidak bisa memutuskan tanpa melihat datanya terlebih dahulu. Terimakasih.

@Eka Yudha : malam mas, saya sedang skripsi, skripsi saya tentang pengaruh pertumbuhan ekonomi, investasi, dan jumlah penduduk. tahun yang di ambil tahun 2006-2010. data yang saya gunakan data dari masing2 kabupaten/kota yang di provinsi banten. mas cara penginputan data ke eviews bagaimana?

Jawab : http://ferdifadly.blogspot.com/2012/03/tutorial-eviews-import-data-panel-file.html coba dibuka mas. Terimakasih.

@anonymous : Asslamualaikum,,
Klo mau download eviews dimana ya?
n apa bia mengolah data panel dengan SPSS?
terima kasih

Jawab : Tanpa mengurangi rasa hormat, mohon namnya dicantumkan. Kemudian pengolahan data panel dapat dilakukan di E-views, Stata, SPSS dan lain-lain. Namun untuk sampai saat ini saya prefer ke E-views dan Stata saja untuk pengolahannya karena segala kemudahannya.

TErimakasih telah berkunjung. NExt Posting. Pengujian asumsi data panel!!! (10 Mei 2013)

Anonymous said...

Malam mas, saya sedang nyusun skripsi menggunakan gravity panel,, ada perbedaan ga cara pengimputan datanya dengan pengimputan regresi panel pd umumnya? Oiya,saya pake eviews 6 (dyta)

Ferdian Fadly said...

Menurut saya tidak ada perbedaan dalam penginputan datanya. Namun, ditambahkan variabel jarak sebagai syarat utama dalam spesifikasi model gravitasi...

helya fanomo said...

maaf mas, ada gak modul lengkap tentang penyelesaian regresi dengn data panel ni pake eviews 7? saya lagi skripsi dan saya sampai sekarang belum menemukan titik terang. mohon batuan mas ferdi.

Ferdian Fadly said...

maaf mas, ada gak modul lengkap tentang penyelesaian regresi dengn data panel ni pake eviews 7? saya lagi skripsi dan saya sampai sekarang belum menemukan titik terang. mohon batuan mas ferdi.

Jawab : Terimakasih telah berkunjung...kalau modul lengkapnya saya tidak tahu ni ada apa tidak...Tapi kalau untuk referensinya, saya menggunakan greene....

Anonymous said...

apakah cara baca hasil regresi data panel menggunakan eview dengan menggunakan spss berbeda?

Ferdian Fadly said...

Eviews ataupun SPSS itu hanya software. Seharusnya kita berangkat dari metode analisis apa yang digunakan, disanalah letak perbedaan interpretasinya. Tidak pada perbedaan softwarenya...terimakasih. telah membaca....ferdi...

Anonymous said...

siang mas, saya ahmad faaiq, mau bertanya. spss bisa digunakan untuk mengolah data panel atau tidak?
kalau ada, apa alasannya? dan ada referensinya kah?
maaf sebelumnya, ini untuk skripsi saya mas. terima kasih.

Anonymous said...

malam mas..
saya ika..
saya mau tanya 3 pertanyaan nih mas ..
a. Bagaimana menguji kausalitas dan kointegrasi jenis data panel yaitu pertumbuhan ekonomi dan IPM provinsi-provinsi di Indonesia periode 2000-2011?
b. Apakah pengujiannya dilakukan tiap provinsi (maka dilakukan 33 kali pengujian) atau dapat dilakukan dengan sekali pengujian dengan melibatkan 33 provinsi tersebut (hanya 1 hasil regresi) ??
c. Apakah bisa dilakukan uji kausalitas dan kointegrasi tanpa melakukan regresi metode panel data?

Ferdian Fadly said...

Tanya : siang mas, saya ahmad faaiq, mau bertanya. spss bisa digunakan untuk mengolah data panel atau tidak?
kalau ada, apa alasannya? dan ada referensinya kah?
maaf sebelumnya, ini untuk skripsi saya mas. terima kasih.

Jawab : @mas Faiq : Bisa dilakukan SPSS untuk model common. Tapi untuk fixed dan random effect, saya tidak merekomendasikan menggunakan SPSS.

TANYA: malam mas..
saya ika..
saya mau tanya 3 pertanyaan nih mas ..
a. Bagaimana menguji kausalitas dan kointegrasi jenis data panel yaitu pertumbuhan ekonomi dan IPM provinsi-provinsi di Indonesia periode 2000-2011?
JAWAB : bisa dilakukan, namun di stata menggunakan do files utuk panel cointegration.
Maaf kan saya mbak ika, saya belum dapat memberi informasi lebih lanjut mengenai ini, karena saya juga sedang mempelajarinya. Namun, jika ingin berdiskusi lebih lanjut mengenai ini dapat mengubungi saya di email 07.5356@gmail.com...

indira said...

mas maaf mau bertanya untuk buku referensi mengenai panel data atau panel survey dasar disarankan apa ya mas?maaf masih pemula

Ferdian Fadly said...

Buku yang saya gunakan greene tapi kalau untuk dasar basic econometrics nya gujarati sangat bagus

Seprinaldi Luthan said...

mas, saya mau tanya..
olahan data panel saya setelah menggunakan uji chow, ternyata model yang saya gunakan adalah model PLS. yang ingin saya tanyakan, apakah model PLS atau model FEM dan REM itu distribusi datanya harus normal? kalau menggunakan PLS, kata dosen pembimbing saya harus menggunakan uji asumsi klasik. bagaiman cara uji autokorelasi, uji multikol dan uji heteroskedastisitas meenggunakan views?

terimakasih sebelumnya

Iman said...

selamat sore mas Ferdian,

saya sedang mengolah data utk penelitian saya dengan time series (2002-2011) + cross section (ada 40 perusahaan), utk regresinya apakah saya bisa menggunakan SPSS atau harus Eviews? supaya datanya bisa disederhanakan dengan mengambil data rata2 selama 10 thn tsb (dng menambahkan thn ke-1 smp thn ke-10 kemudian dibagi 10) apakah diperkenankan (sehingga seolah-olah datanya menjadi cross section)

Ferdian Fadly said...

@seprinaldi :Kalau memang terpilih model Pooled Least Square (common effect)...pengujian asumsinya seperti kita lakukan cross section saja

@iman : Alangkah lebih baik fokus pada tahun tertentu dibandingkan dilakukan rata-rata seperti itu....misalnya tahun 2011, atau tahun yang dianggap titik permasalahannya....dan dilakukan analisis data cross section biasa....
Tapi kalau ingin juga melihat pergerakan masing-masing perusahaan nya gunakan pengolahan data panel.

Anonymous said...

Saya riri. .ada yg ingin saya tanyakan untuk normalitas data menggunakan evieww. .kalau data tdak normal untuk treatmentnya apa ya? Mkash

Ferdian Fadly said...

Treatment untuk mengatasi data yang tidak normal? mm...perlu dipelajari dulu datanya tidak normal kenapa? apa yang menyebabkan distribusi error kita rusak....Kondisi ekstrem itu bisa terjadi karena situasi tidak terduga yang tidak terjelaskan oleh model kita.
Apabila datanya cross section, mungkin kita akan dengan gampangnya menghilangkan outlier, akan tidak menjadi masalah. Namun, bila kita berhadapan dengan data panel atau series, permasalahannya tidak sesederhana itu.
Apabila data series kita hilangkan outliernya, bisa bisa malah ada series atau tahun yang hilang misalnya. Hal serupa juga terjadi pada data panel. Jadi, penghapusan outlier sangat tidak disarankan.
Hal yang mungkin dilakukan adalah
Pelajari Kapan outlier itu terjadi? Misalnya kita memiliki penelitian dengan periode 2008-2013. kita yakini ada hal aneh pada error di 2008, yang tidak terjelaskan oleh model, misal dugaan karena krisis atau hal lainnya. Mungkin kita bisa mempertimbangkan periode penelitian 2009-2013 atau memberikan dummy krisis. Hal ini, sangat dimungkinkan karena hal yang tidak terjelaskan oleh model. Sungguh beruntung, apabila kita bisa menemukan variabel yang bisa menjelaskan mengapa outlier itu terjadi, tetapi jika memang sulit penggunaan dummy mungkin dapat menjadi alternatif.
Solusi lain juga dapat kita sampaikan, apabila kita tahu benar apa asal muasal outliernya. Misalnya hubungan yang seharusnya log-log, kita gunakan linear.
Intinya, tetap semangat dan mencoba. Model adalah seni ri.
Semangat
Ferdi

Anonymous said...

wah masukannya banyak sekali :)
untuk data saya menggunakan panel mas, krn ada beberapa nilai negatif sptnya log tdak bisa saya gunakan. saya coba tambahkan sampel dan tahun nilai JB justru lebih besar (di atas 70 dng nilai sig 0,00).
yg ingin saya tnyakan, kalau saya tetap lanjutkan ke uji asumsi yg lain bgmaimana mas?
memberikan dummy bgaimana mas? maaf blm jelas
mkasih sblmnya

Ferdian Fadly said...

Sebaiknya diperbaiki dulu mas kenormalannya...jangan ke pengujian lain dulu...mungkin bisa perbaiki hubungan variabelnya....dengan mengadopsi dummy misalnya....tambahkan variabel bantuan dalam modelnya....

Anonymous said...

mas saya mau nanya. skripsi saya variabel x nya 5 dan variabel y nya 1 tetapi dummy variable. data penelitian saya data panel karena mengamati 36 perusahaan dan dalam kurun waktu 7 tahun. cara meregresinya gimana ya mas? dan menggunakan software apa? terima kasih

Ferdian Fadly said...

Saya menggunakan Stata dalam pengolahan regresi logistik untuk data panel...

yulia mardani said...

Assalamualaikum Ferdi..

Yulia nih..NRT..xixixi
Aku mau tanya ah mumpung ngomongin tentang panel. Aku lagi bingung gimana ngakalin (solusi ding) time-invariant variabel (individual effect) dalam gravity model (jarak, FTA, bahasa, batas negara, dll). Aku baca di 2 jurnal katanya bikin model regresi sendiri tentang individual effect itu. Yang aku bingung dependent variable nya nilai apa ya? Di jurnal cuma bilang, dependent var: fixed effects. Time-invariant variable sbg independent variable-nya (Greene, 2010: Export potential for US advanced technology goods in India using a gravity model approach)

Ferdian Fadly said...

Waalaikumsalam....hahahaha...ya mbak....
model gravitasi ya....baca ini dulu boleh mbak
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCcQFjAA&url=http%3A%2F%2Flontar.ui.ac.id%2Ffile%3Ffile%3Ddigital%2F125856-5635-Faktor-faktor%2520yang%2520mempengaruhi-Metodologi.pdf&ei=imxMU-jUIcfRrQfPp4GADQ&usg=AFQjCNEucxS4JEKiFhW3Vbgk2F0mpBBiag&sig2=rtG9a3Loh_j2IkWviU78Zg&bvm=bv.64764171,d.bmk

Post a Comment

Related Posts Plugin for WordPress, Blogger...
Twitter Delicious Facebook Digg Stumbleupon Favorites More

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Web Hosting Coupons