Tahapan selanjutnya setelah melakukan Eksplorasi adalah Tahapan Identifikasi. Salah satu teknik paling sederhana yang digunakan pada tahapan identifikasi adalah scatter plot. Scatter Plot merupakan plot ataupun gambaran yang menunjukkan hubungan antara suatu variabel (katakanlah X pada sumbu X) dan variabel lainnya (katakanlah Y pada sumbu Y).
Gambar 1. Scatter Plot
Scatter plot dapat menjadi identifikasi awal yang sangat efektif dan efisien mengenai model apa yang sebaiknya digunakan. Dari Gambar 1 terlihat bahwa ada kecendrungan hubungan linear antara Explanatory Variable (X) dengan Response Variable (Y) sehingga model yang paling tepat regresi linear. Begitupun apabila plotting kita membentuk hubungan kuadratik sehingga tentulah model paling tepat adalah regresi polinomial dalam kasus ini regresi kuadratik, dst.
Nah, Scatter plot dapat kita lakukan apabila kita masih berhadapan dengan variabel bebas (X) yang tidak banyak. Tapi, apabila telah memiliki banyak variabel bebas tentulah pembuatan scatter plot menjadi hal yang sulit untuk dilakukan. Hal yang dapat kita lakukan jika berhadapan dengan X yang banyak adalah identifikasikan saja variabel bebas nya, untuk menetapkan model apa yang akan kita gunakan seperti terlihat pada pengelompokkan dibawah ini.
Y X Model
Kuantitatif Semua X kuantitatif Regresi Linear Berganda (RLB)
Kuantitatif Sebagian X kualitatif RLB dengan memanfaatkan dummy Variabel
Kuantitatif Semua X kualitatif Anova
Kualitatif Semua X kuantitatif Analisis Diskriminan/ RegLog(Logit/Probit)
Kualitatif Sebagian X kualitatif Regresi Logistik (model Logit/Probit)
Kualitatif Semua X kualitatif Log-Lin Model
Setelah berhasil melakukan identifikasi, tetapkan modelnya. Kemudian,kita akan melanjutkan kepada Tahapan Estimasi. Terimakasih atas kunjungannya...=D
Nah, Scatter plot dapat kita lakukan apabila kita masih berhadapan dengan variabel bebas (X) yang tidak banyak. Tapi, apabila telah memiliki banyak variabel bebas tentulah pembuatan scatter plot menjadi hal yang sulit untuk dilakukan. Hal yang dapat kita lakukan jika berhadapan dengan X yang banyak adalah identifikasikan saja variabel bebas nya, untuk menetapkan model apa yang akan kita gunakan seperti terlihat pada pengelompokkan dibawah ini.
Y X Model
Kuantitatif Semua X kuantitatif Regresi Linear Berganda (RLB)
Kuantitatif Sebagian X kualitatif RLB dengan memanfaatkan dummy Variabel
Kuantitatif Semua X kualitatif Anova
Kualitatif Semua X kuantitatif Analisis Diskriminan/ RegLog(Logit/Probit)
Kualitatif Sebagian X kualitatif Regresi Logistik (model Logit/Probit)
Kualitatif Semua X kualitatif Log-Lin Model
Setelah berhasil melakukan identifikasi, tetapkan modelnya. Kemudian,kita akan melanjutkan kepada Tahapan Estimasi. Terimakasih atas kunjungannya...=D
7 comments :
hmm... aroma statistik buanget... :) semangat mengakrabkan ilmu statistik di masyarakat.. :)
makasih Rishinsa...iya...lagi belajar juga....belajar blog sekalian belajar statistik...mohon bimbingannya ya...=D
permisi bang, mau nanya, bisakah data relatif (%) diregresikan secara linier dengan data absolut? apakah abang punya buku referensi yang berkaitan dengan hal tersebut.
mohon bantuannya bang...
makasih banyak :)
Pada dasarnya, sesuai dengan prinsip saya...statistik itu adalah seni...maka pembuatan model itu juga merupakan bagian dari seni itu sendiri...ekspresikan model yang kita buat dengan bebas, tapi layaknya seni, ada peraturan-peraturan dalam seni itu sendiri kan?? selama aturan itu ga terlanggar, so ga masalah toh??=D
ketika melihat variabel-variabelnya seperti yang saya sampaikan disini identifikasi modelnya...apakah itu regresinya linear atau bagaimana...perhatikan pola yang terbentuk dari scatter plotnya..linier kah, kuadratik atau lain-lain...kalau masih 2 variabel masih bisa dilihat polanya koq...
kalau untuk membuat model seperti itu juga menurut saya gak masalah...
contohnya: kita akan memodelkan antara tingkat pengangguran terbuka (dalam persen) dengan jumlah penduduk miskin (dalam ratusan ribu orang)
diperoleh:
jumlah_penduduk_miskin = a + b*tingkat pengangguran
berarti kan bisa tu...jd ceritanya setiap kenaikan tingkat pengangguran sebesar 1 persen menyebabkan kenaikan jumlah penduduk miskin sebanyak b ratus ribu orang...
yang lebih harus kamu perhatikan adalah tahap tahap selanjutnya, apakah model yang telah dihasilkan dapat melewati tahapan hingga uji asumsi dan kelayakan model...hohoho...trims telah bertanya...=D
Makasih banyak ya bang atas jawaban pertanyaan saya, baru baca komennya, hehe. ooo, jadi gitu ya bang, saya bingung-bingung dangdut mau meregresikan variabel yang ga sama satuannya. Jadi, awalnya kita harus membuat scatter plot dulu ya bang? kalau misalnya variabelnya ada empat (termasuk variabel dependent-nya), cara bikin scatter plotnya gimana ya bang? apa harus dilakukan secara terpisah antar variabel? *jadi nanya lagi :))*
bikin juga dong bang di blognya langkah-langkahnya buat mbantuin saya yang rada kurang ngerti ini, biar maslahat juga bang... :))
Iya sama-sama,,,scatter plotnya buat model sedrhana saja, misalnya satu variabel independen mempengaruhi variabel dependen nya...tetapi kalau variabel independen/bebas lebih dari satu untuk identifikasinya tidak digunakan scatter plot lagi,,tapi cukup dengan menentukan variabel bebasnya apakah kuantitatif semua, atau kualitatif atau sebagian kuantitatif...untuk kemudian menentukan model regresi yang kita gunakan, seperti yang saya sampaikan pada postingan di halaman ini....
Terima kasih untuk postingannya sangat bermanfaat buat saya yang baru belajar meneliti ini....Chica Bonita
Post a Comment