Sunday, July 1, 2012

[Tutorial SPSS] Analisis Regresi Logistik Biner


Minggu yang lalu, saya telah menyampaikan mengenai konsep dari analisis regresi logistik biner. Pada minggu ini, saya akan coba melanjutkan pembahasan berkaitan dengan langkah-langkah pengolahan nya dengan menggunakan bantuan program SPSS. Langkah-langkahnya adalah sebagai berikut :
1.      Buka lah program SPSS yang anda miliki

2.    Input data nya -->sebagai contoh, data yang saya gunakan adalah data latihan dari buku Categorical Data Analysis (Alan Agresti, 2007, edisi 2 --> halaman 132), pada kasus saya variabel penjelasnya ada 2 (Durasi skala rasio dan T dengan skala nominal) dan variabel terikatnya Y dalam bentuk nominal (terdiri atas 2 kategori-->biner)

3.   Pilih opsi variabel view, lalu ubahlah variabel name dan label-nya sesuai dengan kasus masing-masing. Saat ini, saya akan menggubah nama menjadi D, T dan Y misalnya. Kemudian Values nya disesuaikan nilainya. Bila data berbentuk nominal atau ordinal (misalnya untuk T dan Y),  measure nya diganti dari scale menjadi nominal.

4.      Data telah beres, kemudian pilih opsi Analyze > Regression > Binary Logistics

5.      Masukkan Y sebagai variabel Dependent dan D serta T sebagai covariates. Untuk Method nya saat ini saya masih tetap menggunakan enter.

6.      Karena T berbentuk kategorik, maka harus ditetapkan reference Category nya dengan cara memilih opsi Categorical. Untuk kemudahan interpretasi biasanya saya memilih first untuk reference nya.  Artinya setiap kategori akan diperbandingkan dengan kategori pertama. Kemudian JANGAN LUPA pilih change. Klik Continue.

7.  Pilih options. Kemudian centang hosmer lemeshow dan classification plots dan klik continue. Kemudian OK.

Ok...Untuk Interpretasi Outputnya silahkan membaca postingan berikutnya yang berjudul : Analisis Regresi Logistik (interpretasi). Terimakasih telah membaca... -Ferdi Fadly -

50 comments :

sangat mujarap said...

sangat bermanfaat sekali contohnya .......

Manual said...

boleh juga untuk di coba , meluncur gan ???

Ferdian Fadly said...

Semoga dapat membantu ya....terimakasih atas kunjungannya

fajri said...

wah... ini blog nya k' ferdy ya??
mantap kak... makasih udah sharing ilmunya...

saya fajri kak,, juniornya dulu di smandel, n smp6... :)

Ferdian Fadly said...

Hoho...dr. Fajri ya???...sama-sama masbrow...Keep posting too ya...saya pernah baca juga tulisannya...terimakasih...=)

agung said...

alhamdulillah. tks

Ferdian Fadly said...

Alhamdulillah...Terimakasih mas agung...Hohoho...nama nya mengingatkan saya kepada yang mengajarkan saya analisis regresi logistik ini...jadi terimakasih kembali telah mengingatkan saya...Pak Agung...=D....

Alin said...

selamat pagi pak ferdy.. saya mau tanya bagaimana dengan langkah analisis reg logistik ordinal dan cara baca outputnya bagaimana? trimaksih

Benagustian said...

Pak saya lagi nulis skripsi menggunakan analisis logistik karena varibel dependen menggunkan kategori tapi setelah liat data semua berkategori "ya" atau 1, apakah penelitians aya bisa dilanjutkan dnegan analisis logistik ini? atau pakai analisis apa? terimkasih

Ferdian Fadly said...

Pak Alin : selamat pagi pak ferdy.. saya mau tanya bagaimana dengan langkah analisis reg logistik ordinal dan cara baca outputnya bagaimana? trimaksih

Jawab : Kalau untuk analisis regresi logistik ordinal, akan ada namanya pengujian lagi untuk parallel lines nya, akan coba saya bahas di penulisan berikutnya. Terimakasih atas idenya.

Pak BEnagustian : Pak saya lagi nulis skripsi menggunakan analisis logistik karena varibel dependen menggunkan kategori tapi setelah liat data semua berkategori "ya" atau 1, apakah penelitians aya bisa dilanjutkan dnegan analisis logistik ini? atau pakai analisis apa? terimkasih

Jawab : saya sudah coba jawab di email, namun akan coba saya sampaikan disini kembali ya. Sepengetahuan saya regresi logistik biner berangkat dari distribusi binomial dimana mensyaratkan adanya kondisi sukses dan gagal. Dalam perkembangannya analisis regresi logistik, dapat juga diterapkan untuk berkategori sukses semua, namun HARUS ADA periode kapan mencapai sukses tersebut. Analisis ini dinamakan Analisis survival. Analisis ini sering digunakan di bidang kesehatan atau di perbankan.

tu2ts_sine said...

Apa arti dan makna Step 1 atau Step 2 pada analisa regresi logistik?
Apakah hasil out put regresi logistik selalu berakhir dengan tabel equition?

Ferdian Fadly said...

Apa arti dan makna Step 1 atau Step 2 pada analisa regresi logistik?
Apakah hasil out put regresi logistik selalu berakhir dengan tabel equition?

Jawab : Terimakasih mbak tutut...
Pernah baca tulisan saya ini? ferdifadly.blogspot.com/2012/07/interpretasi-output-analisis-regresi.html

Kalau boleh tahu step 1 atau step 2 itu di bagian mana ya, trims...

kang dam said...

kenapa yang kodung variabel Y selalu 0 dan 1. walaupun di data view maupun pemasaukan data kita udah setting 1 dan 2.

Ferdian Fadly said...

Perlu disampaikan distribusi dari model ini adalah binomial, dimana Ada kondisi sukses (1) Dan gagal (0)

Istianingrum Anggiyani said...
This comment has been removed by the author.
Yuda Purnama said...

Aslm, mas saya mau tanya untuk yg di reference category itu saya masih belum ngerti maksud dari "last" sama "first" itu? untuk yg first itu "setiap kategori akan diperbandingkan dengan kategori pertama" itu maskudnya gimana mas? terima kasih sebelumnya soalnya saya lagi skripsi pake analisis regresi logistik :)

Ferdian Fadly said...

Misalnya x nya terdiri atas 3 kategori tingkat pendidikan terakhir...1=SD, 2=SMP, 3=SMA...otomatis akan terbentuk 2 dummy (jumlah kategori=3 dikurangi 1)...jika menggunakan first, maka kategori2 tersebut akan dibandingkan dengan SD
katakanlah exp(b1)=1,5...;dimana b1 merupakan koefisien dari kategori SD, kemudian exp(b2)=1,8...y nya sukses=1....gagal=0
Maka...kecendrungan seorang lulusan SMP untuk sukses 1,5 kalinya dibandingkan seorang lulusan SD...Sementara itu, kecendrungan seorang lulusan SMA untuk sukses 1,8 kalinya dibandingkan lulusan SD...

Jika reference nya last...maka kategori pembandingnya justru SMA...dan scara otomatis koefisien b akan dihitung ulang sehingga exp(b) nya pasti berbeda dengan sebelumnya...misal exp(b1)=0,5 dimana b1 merupakan koefisien dari dummy kategori lulusan SD

sehingga--> kecendrungan seorang lulusan SD untuk sukses 0.5 kalinya dibandingkan lulusan SMA....dst..

Terimakasih

Yuda Purnama said...

oh begitu ya mas, oke mas sekarang saya mengerti. terima kasih banyak ya mas untuk penjelasannya yang sangat bermanfaat sekali. :D

Ferdian Fadly said...

Sipz sama sama

yuliastuti said...

Selamat pagi mas ferdi,, perkenalkan nama saya Yuliastuti, mahasiswi semester 4 pascasarjana UNHAS, Makassar.
Saat ini saya sedang berjuang menyusun tesis untuk menyelesaikan studi magister saya.
Data penelitian saya menggunnakan analisis regresi logistik biner,, dan saya belajar analisis, tutorial pengolahan hingga interpretasi hasil analisis dari materi yang mas ferdi terterakan di blognya mas ferdi.
Saya sudah mengikuti semua prosedur yang ada dalam blog mas ferdi, tapi saya menemukan banyak kendala dalam output dan data saya.
Kendala-kendala yang saya temukan seperti:
1. pada output, kolom pertama muncul "warning" "the parameter covariances matrix cannot be computed. remaining statistics will be ommited"..
2. variabel-variabel independen saya tidak ada yang berpengaruh signifikan terhadap variabel dependen saya, sedangkan saya dituntut oleh pembimbing tesis saya untuk membuat data yang "berpengaruh nyata",, saya sudah berulang kali mengubah data saya dan memodifikasi data saya, hasilnya bermacam-macam, ada yang bepengaruh signifikan tapi muncul warning2 seperti point 1 di atas, ada juga hasil yang tidak muncul warning2 nya tapi tidak berpengaruh nyata. kira-kira bagaimana saya bisa memecahkan solusinya mas? mohon bantuan n bimbingannya..
3. model tidak sesuai,, sama hal nya dengan point 2, bagaimana caranya sehingga saya bisa menghasilkan data yang sesuai dengan model?
Mohon bantuannya mas ferdi,, Terima kasih banyak

Anonymous said...

bisa share tutorial regresi logistik ordinalnya gak ?

Ferdian Fadly said...

@yuliastuti : hal tersebut sering terjadi akibat variabel independen yang berkorelasi kuat satu dengan lainnya (multikolinearitas)....banyak opsi yang bisa dilakukan...salah satunya adalah mengurangi variabel bebasnya...terimakasih..

isti qomah said...

sangat membantu mas, terimakasih

h!a!m!z!a!h said...

Mohon informasi perbedaan makna reference category antara pilihan first dan last pada define categorical covariates, lbinary ogistic regression, atau kapan opsi first dan last pada independen variable digunakan. Tks

Ferdian Fadly said...

Hal tersebut erat kaitannya dengan interpretasi mas hamzah.....saya misalkan kondisinya adalah seperti ini ya....y=0 tidak miskin, 1 miskin....X1=0 pendidikan tinggi rendah, pendidikan tinggi.....ketika menggunakan first dan ketemu odds rationya 0,5, maka.....kecendrungan orang yang berpendidikan tinggi untuk miskin 0,5 kalinya dibandingkan orang berpendidikan rendah.....artinya berpendidikan rendah jadi kondisi basic nya.....jadi kalau dibuat last....maka kondisi basic nya menjadi pendidikan tinggi, dan otomatis odds rationya akan menyesuaikan menjadi....2....artinya....kecendrungan orang berpendidikan rendah untuk miskin 2 kalinya dibandingkan orang berependidikan tinggi...

andi fitra said...

Mas, interpretasi untuk regresi logistik ordinalny tau ga', mas?
Share tutorialny dong mas.

Ferdian Fadly said...

@andi terimakasih...akan coba saya pertimbangkan

Anonymous said...

Selamat sore pak, saya agnes mahasiswi di salah satu universitas di tangerang. Saat ini saya sedang mengambil skripsi dan menggunakan regresi logistik. Saya sudah oleh data tetapi hasilnya 3 dari 4 variabel saya tidak berpengaruh terhadap dependent (diatas 0,05), jika berdasarkan semua jurnal acuan saya seharunya semua independen saya berpengaruh terhadap dependen. Sepertinya saya salah dalam pengaturan di spssnya pak. Variabel independen saya merupakan variabel dummy dan independennya menggunakan skala rasio. Saya ingin bertanya pak, apa saja yang perlu diatur dalam spssnya jika variabelnya seperti itu? Terima kasih Pak

deny said...

mas bagaimana klo T merupakan kategori lebih dari 2 kategori, caranya bgmn, saya blm nemu tutorialnya. makasih

Ferdian Fadly said...

@Anonymous said...
Sayya tidak tahu pasti apa yang terjadi...tetapi solusi yang dapat dilakukan diantaranya adalah
- Periksa spesifikasi model sekali lagi
- Periksa outlier
- reklasifikasi variabel
- jangan berhenti mencoba
- kalau ikhtiarnya sudah benar, dan memang hasilnya seperti itu, tinggal mencari alasan yang tepat, mengapa pada penelitian kita anomali tersebut terjadi...katakanlah jurnal acuan kita negara lain, berarti untuk indonesia, situasinya bisa saja berbeda...


December 12, 2015 at 5:30 PM
deny said...

mas bagaimana klo T merupakan kategori lebih dari 2 kategori, caranya bgmn, saya blm nemu tutorialnya.makasih
@mas deni : terimakasih, caranya sudah sama mas.....kuncinya adalah pada variabel view itu kalau kategori mau itu 2,3,4,5 atau berapapun kategori kek,,,pada variabel view nya ganti measure untuk si kategori itu dengan nominal....nah dengan demikian,,,otomatis pada outputnya nanti mas akan menciptakan dummy variabel koq,,,yang tadinya disini cuma ada T saja...nanti kalau di kasus nya mas akan ada T1 dan T2 nya...selamat mencoba

Anonymous said...

selamat siang, pak. saya mahasiswi tingkat akhir yang sedang melakukan penelitian dengan judul "Pengaruh Kebijakan Kas, Kebijakan Persediaan dan Kebijakan terhadap Nilai Perusahaan" Kebijakan persediaan dalam penelitian saya merupakan variabel dummy, yakni kebijakan perusahaan dalam memilih metode persediaan rata-rata atau fifo. berkaitan dengan penelitian saya, apakah bapak bisa memberi saran analisis apa yang sebaiknya saya gunakan? sebelumnya saya ucapkan terima kasih.

Ferdian Fadly said...

@Anonymous : selamat siang, pak. saya mahasiswi tingkat akhir yang sedang melakukan penelitian dengan judul "Pengaruh Kebijakan Kas, Kebijakan Persediaan dan Kebijakan terhadap Nilai Perusahaan" Kebijakan persediaan dalam penelitian saya merupakan variabel dummy, yakni kebijakan perusahaan dalam memilih metode persediaan rata-rata atau fifo. berkaitan dengan penelitian saya, apakah bapak bisa memberi saran analisis apa yang sebaiknya saya gunakan? sebelumnya saya ucapkan terima kasih.

# untuk menetapkan suatu alat analisis, kita harus paham dulu apa skala data dari masing masing variabel bebas dan variabel tidak bebasnya...
kebetulan anda komen disini (regresi logistik)
pada regresi ini,,variabel tidak bebas (Y) nya adalah variabel sukses gagal (0 dan 1)...sementara variabel tidak bebasnya boleh kuantitatif, boleh kualitatif sebagian....

nah, silahkan anonymous, anda variabel Y nya apa?nilai perusahaan? nilai perusahaan itu berupa kategri misalnya 1,2,3..atau ABC....atau tinggi sedang rendah...atau berupa kuantitaif, katakanlah 80, 90, 93, 100...

Tiara Zhahira said...

Selamat siang saya mau bertanya sama mas ferdi
Pengujian hipotesis saya kan menggunakan analisis multivariate serentak dan terpisah. Waktu pengujian multivariate scr serentak didapat hasil jika variabel independen tidak ada yg berpengaruh signifikan terhadap variabel dependen, setelah itu saya menguji dengan multivariate scr terpisah menggunakan backward stepwise didapat hasil yang berbeda dr pengujian serentak. Bahwa ada salah satu variabel independen berpengaruh signifikan terhadap variabel dependen. Trs yg mau saya tanyakan adalah saya harus berkesimpulan apa di dalam pembahasan? Intinya variabel independen tsbt ditetapkan berpengaruh atau tidak pada variabel dependen. Terima kasih. Mohon bantuannya untuk mengerjakan skripsi.

Ferdian Fadly said...

@tiara zhahira : overall test nya lihat pada model yang dipilih saja mbak....katakanlah awal nya ni ada X1,X2,X3,X4...ketika di regresikan dengan Y, ternyata gak ada yang signifikan overall nya..otomatis...partialnya juga....pasti tidak ada yang signifikan...

kemudian kita lakukan running dengan backward...nah, dengan backward kan dicobain terus tu X1,X2,X3,X4 atau X1,X2,X3 atau X1,X2 atau ternyata cuma terpilih X2 saja... sehingga model yang mbak tetapkan terpilih adalah model Y=f(X2)...saja...nah itu overall test nya jangan lihat yang X1,X2,X3,X4 nya ketika masih bareng bareng lagi...lihat overall nya cukup pada kondisi terkhir yang mbak pilih saja...konsisten koq...

Tiara Zhahira said...

Berarti dianggap signifikan ya? Karna variabel yg tersisa dalam metode backward stepwise tahap yg terakhir (step 4) menunjukkan nilai p-value < 0,05

Ferdian Fadly said...

@tiara...koq dianggap? memang signifikan....boleh saya lihat data dan outputnya?

Tiara Zhahira said...

Sudah saya kirim mas ferdi. Thankyou

Ferdian Fadly said...

Sudah saya balas

Anonymous said...

Selamat malam Pak Ferdi, Saya Rani, salah satu mahasiswa tugas akhir yang sedang proses membuat skripsi.. saya mau numpang tanya, saya menggunakan regresi logistik dalam skripsi saya. kendalanya ialah bahwa salah satu variabel X saya berbentuk nominal dalam angka triliunan sedangkan variabel lainnya dalam bentuk rasio. yang ingin saya tanyakan ialah, apakah var.X triliunan tadi harus ditransformasi ataukah bisa hanya di tulis dalam bentuk miliaran rupiah?
misalnya : 160.160.258.100.000 ditulis 160.160 (dalam miliaran rupiah)?

Ferdian Fadly said...

@anonymous: hasilnya ga akan banyak pengaruh sih, tapi biasanya, kalau angkanya besar besar itu, ngaruhnya ke koefisien dan odds aja, jadi interpretasinya agak membingungkan juga....saran saya dinaikkan lagi aja satuannya triliun rupiah... sama itu kalau format excel nya jangan dipakai...karena SPSS kan mengenal titik itu sebagai decimal separatornya....takutnya salah baca...

Mahargian said...

Selamat sore pak ferdy, saya Riskha. Pak, skripsi saya kalo pakai metode enter itu variabelnya tidak ada yg sugnifikan. Kalo pakai metode forward stepwise (conditional) untuk step 1 hanya ada 1 var yg signifikan dari 8 variabel sedangkan step berakhir di step 4. Step 2, 3, sampai 4 tidak ada var yg signifikan. Apa boleh hanya berhenti di step 1 ? Dan mohon bantuannya untuk dijelaskan lagi perbedaan antara metode forward:conditional, likelihood ratio, wald dan metode backward juga. Terimakasih pak

Mahargian said...

Selamat sore pak ferdy, saya Riskha. Pak, skripsi saya kalo pakai metode enter itu variabelnya tidak ada yg sugnifikan. Kalo pakai metode forward stepwise (conditional) untuk step 1 hanya ada 1 var yg signifikan dari 8 variabel sedangkan step berakhir di step 4. Step 2, 3, sampai 4 tidak ada var yg signifikan. Apa boleh hanya berhenti di step 1 ? Dan mohon bantuannya untuk dijelaskan lagi perbedaan antara metode forward:conditional, likelihood ratio, wald dan metode backward juga. Terimakasih pak

Ferdian Fadly said...

@riskha mahargian : it's up to you...dari awal disepakati hanya satu variabel pun tak apa...sekalian di kerangka pikirnya...

forward selection, bakward elimination dan enter...merupakan metode pemilihan model terbaik...
enter : kita masukkan saja variabelnya...tanpa ada yang dibuang, atau dikeluarkan dari model

kalau backward elimination : masukkan seluruh variabel...kemudian variabel yang paling tidak signifikan dikeluarkan satu per satu hingga menyisakan variabel variabel yang optimal mendukung model...

kalau forwaqrd itu justru sebaliknya : pertama masukkan variabel yang paling signifikan, satu per satu...hingga membentuk model yang variabelnya signifikan signifikan semua...

sebenarnya satu lagi ada namanya stepwise : penggabungan dari backward dan forward...masukkan satu per satu variabel yang signifikan, tambahkan variabel lainnya...uji lagi...apa ada yang harus dieliminasi atau tidak...kalau ada yang tidak signifikan,,,eliminasi...eliminasi...kemudian dimasukkan lagi...diuji lagi...terus menerus...

sementara conditional ataupun likelihood, wald, itu hanya statistik uji nya, metode penyeleksiannya...

intan rhema said...

Selamat malam Pak. Saya mau bertanya mengenai regresi logistik ordinal. apabila model tidak sesuai (parallel lines <0.05) padahal saya sudah mengubah function nya, apa yg harus dilakukan agar model tsb menjadi sesuai? Terimakasih banyak

Ferdian Fadly said...

@intan :kalau rasanya parallel lines nya tidak terpenuhi...menurut saya regresi logistik multinomial bisa jadi alternatif opsi yang cukup baik...

biasanya tu ya mbak parallel lines itu kondisinya tak terpenuhi karena adanya perbedaan slope atau kemiringan garis yang cukup signifikan antara kategori y yang satu dengan yang lain..sehingga tidak bisa di paralel kan...di sama ratakan pengaruhnya...sehingga multinomial logistik bisa menjadi alternatif, daripada dipaksakan untuk jadi ordinal dimana ga bisa tu dijadikan satu model dengan parallel lines..

intan rhema said...

Kemarin saya coba menghapus beberapa data dan mengubah function menjadi cauchit, sehingga parallel lines sudah menunjukkan nilai lebih dari 0.05. Yg jd pertanyaan apakah function cauchit itu? Apakah tdk masalah saya menggunakan fungsi itu? Apa Beda nya dgn function logit Dan complementary log-log? Mohon bantuannya. Terimakasih

Ferdian Fadly said...

Fungsi Logit
ln⁡(p/(1-p))=α+β*X1
Gunakan e di kedua sisi
e^ln⁡(p/(1-p)) =e^(α+β*X1)
e ketemu ln maka bisa dicoret
(p/(1-p))=e^(α+β*X1)
Nah, oleh karena itu ketika interpretasi koefisien X1 (dalam hal ini Bheta) tidak bisa secaraLangsung, tetapi harus di eksponensial kan dulu (itu lah yang odds ratio)
Kalau Cauchit fungsinya tan⁡〖(π(p-0,5))〗
Interpretasinya bagaimana ya?
Kalau sudah tahu bisa kasih tahu saya...menurut saya sah sah saja menggunakan sesuatu, asal kita tahu menggunakannya dan bagaimana interpretasinya

intan rhema said...
This comment has been removed by the author.
intan rhema said...

Saya baca2 di internet kalau fungsi cauchit itu digunakan apabila variabel laten bernilai ekstrem. Di situ saya tidak paham Pak, apa yg dimaksud dgn variabel laten dan bernilai ekstrem yg seperti apa. Karena saya tidak merasa memasukkan variabel laten dlm penelitian saya

Alkhwrizmi Consultant said...

Anda memiliki masalah dalam penelitian, skripsi, tesis, dan disertasi anda?? Kami solusinya..
Kami menyediakan jasa konsultasi olah data statistik
Permasalahan anda akan ditangani dengan cepat oleh para profesional yang kompeten di bidang statistik dan ekonometri.
Software statistik yang biasa digunakan diantaranya
1. SPSS, 2. Stata, 3. E-views, 4. Lisrel, 5. Smart-PLS, 6. Program-R, dsb.

Tunggu apalagi.. Hubungi Kami..
Alkhwrizmi Consultan : 0812 7578 4200
Email : alkhwrizmi@gmail.com
http://alkhwrizmi.blogspot.co.id/

Post a Comment

Related Posts Plugin for WordPress, Blogger...

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Web Hosting Coupons