Universitas Airlangga Official Website

Estimator Spline Terpenalty untuk Model Regresi Logistik Biner Semiparametric dengan Aplikasi pada Faktor-Faktor Risiko Penyakit Jantung Koroner

Ilustrasi AIP (Foto: UNAIR NEWS)
Ilustrasi AIP (Foto: UNAIR NEWS)

Regresi logistik merupakan salah satu alat paling mendasar dalam pemodelan statistik karena kinerjanya yang kuat baik dalam tugas prediksi maupun klasifikasi. Varian umum, Regresi Logistik Biner (RLB), bergantung pada asumsi hubungan fungsional antara kovariat dan logit dari respons. Terlepas dari popularitasnya, formulasi regresi logistik parametrik dibatasi oleh asumsi linearitas dalam logit, yang dapat menyebabkan estimasi yang bias atau tidak efisien ketika hubungan sebenarnya menyimpang dari struktur ini. Untuk mengatasi keterbatasan ini, pendekatan regresi logistik nonparametrik memberikan alternatif yang fleksibel karena tidak memaksakan bentuk asosiasi fungsional yang telah ditentukan sebelumnya antara variabel prediktor dan respons. Metode ini bahkan membangun kurva halus yang sepenuhnya didorong oleh data yang diamati, meminimalkan potensi bias dalam pemodelan. Dalam penelitian ini, dikembangkan metode analisis regresi, yaitu Regresi Logistik Biner Semiparametrik (RLBS), dengan memperluas regresi logistik klasik yang mengintegrasikan komponen parametrik dan nonparametrik, yang memungkinkan pemodelan hubungan linier dan nonlinier secara simultan. Metode yang diusulkan ini diterapkan pada data real yakni untuk memoelkan dan menganalisis risiko-risiko penyakit jantung coroner (PJK).

Pada penelitian ini, untuk memperoleh estimasi komponen nonparametrik dalam bentuk kurva non-linier (kurva sigmoid), digunakan spline yang diberi penalti, yang merupakan teknik penghalusan yang digunakan dalam pendekatan nonparametrik karena kemampuannya untuk menghasilkan kurva yang halus dan adaptif untuk data yang berfluktuasi. Dalam teknik penghalusan ini, pemilihan parameter penghalusan optimal memainkan peran penting dalam penentuan model. Umumnya, pemilihan ini didasarkan pada nilai minimum dari Cross-Validation (CV) atau Generalized Cross-Validation (GCV). Namun, kriteria CV dan GCV ini tidak dapat digunakan ketika kurva CV dan GCV terus menurun dan tidak pernah naik; nilai minimum CV dan GCV tidak akan tercapai karena tidak dapat diterapkan secara langsung karena sifat non-kuadratik dari fungsi log-likelihood. Oleh karena itu, kriteria Generalized Approximate Cross-Validation (GACV) digunakan untuk mengatasi kasus-kasus tersebut. Hal ini yang membedakannya dari studi-studi sebelumnya yang menggunakan kriteria CV atau GCV.

Hasil estimasi model peluang risiko terserang PJK menggunakan penedekatan model RLBS adalah sebagai berikut:

Hasil estimasi model RLBS untuk risiko PJK adalah sebagai berikut:

Hasil evaluasi model yang diusulkan (yakni, model RLBS yang direpresentasikan PS-SBLR) dan hasil perbandingan dengan model klasik disajikan  dalam tabel berikut ini.

Lebih lanjut, temuan utama menunjukkan bahwa Usia (Xi) mempertahankan korelasi positif linier dengan risiko PJK. Namun, variabel kontinu seperti Berat Badan, Konsumsi Makanan Manis, dan Tingkat Stres menunjukkan perilaku non-linier yang signifikan. Secara khusus, analisis mengidentifikasi ambang risiko kritis untuk Konsumsi Makanan Manis (t3i) pada 4,34 g, di mana risiko bergeser dari protektif menjadi berbahaya. Demikian pula, Konsumsi Makanan Berlemak (t4i) menunjukkan transisi yang jelas ke peningkatan risiko di atas 17,29 g. Yang paling penting, model tersebut menangkap pola risiko yang berbeda pada Tingkat Stres (t5i). Sementara stres rendah (kurang dari 5) bersifat protektif, stres sedang (skor 5–7) diidentifikasi sebagai prediktor paling berbahaya, dengan Rasio Odds (OR) tertinggi (OR = 3,0535) dan peningkatan risiko yang signifikan terkait dengan stres berat. Hasil ini juga menegaskan bahwa model yang diusulkan (yakni, model RLBS) menawarkan alternatif yang kuat dengan secara efektif menyeimbangkan interpretasi dan ketepatan prediksi.

Akhirnya diperoleh kesimpulan bahwa hasil penelitian ini berhasil menunjukkan kemampuan metode yang diusulkan dalam mengidentifikasi ambang batas non-linier kritis untuk faktor risiko PJK, dan secara statistik valid serta sangat efektif untuk prediksi risiko PJK. Di masa mendatang, kita dapat menggunakan hasil penelitian ini sebagai dasar sistem peringatan dini, khususnya untuk memperingatkan individu dengan tingkat stres sedang dan kebiasaan makan yang melebihi ambang batas yang telah diidentifikasi agar menyadari peningkatan kemungkinan terkena PJK. Selain itu, penelitian ini selaras dengan poin ketiga Tujuan Pembangunan Berkelanjutan (SDGs), yaitu pengurangan angka kematian dini akibat penyakit tidak menular pada tahun 2030.

Penulis: Prof. Dr. Nur Chamidah, S.Si., M.Si.

Informasi lengkap (detail) dari penelitian ini dapat dilihat pada tulisan kami di laman:

https://doi.org/10.3390/sym18030432

Chamidah, N.; Rifada, M.; Lestari, B.; Aydin, D.; Siregar, N.R.A.A. (2026). Penalized Spline Estimator for Semiparametric Binary Logistic Regression Model with Application to Coronary Heart Disease Risk Factors. Symmetry, 18(3), 432, pp. 1 – 31. DOI: 10.3390/sym18030432.