Penyakit kardiovaskular (PKV), yang mencakup berbagai penyakit yang memengaruhi
jantung dan pembuluh darah, merupakan tantangan kesehatan global yang signifikan. Sebagaimana disoroti oleh Organisasi Jantung Dunia (WHO) dan Asosiasi Jantung Amerika, PKV merupakan penyebab utama kematian di seluruh dunia, dengan sekitar 17,9 juta kematian dilaporkan pada tahun 2019 dan meningkat menjadi 20,5 juta pada tahun 2021. Penelitian ini bertujuan untuk mengusulkan model prediksi baru untuk penyakit kardiovaskular, menggunakan pendekatan sinergis yang mengintegrasikan algoritma bagging, HGB, LOF, IG, kfold CV berstrata, dan GridSearchCV.
Penelitian ini menyajikan sebuah model prediksi baru untuk penyakit kardiovaskular yang menggunakan algoritma bagging yang menggabungkan peningkatan gradien histogram sebagai estimatornya. Studi ini memanfaatkan tiga set data kardiovaskular yang telah diproses sebelumnya, menggunakan teknik Faktor Outlier Lokal untuk menghilangkan outlier dan metode perolehan informasi untuk pemilihan fitur.
Melalui eksperimen yang ketat, model yang diusulkan menunjukkan kinerja yang unggul dibandingkan dengan pendekatan pembelajaran mesin konvensional, seperti Regresi Logistik, Klasifikasi Vektor Pendukung, Gaussian Naïve Bayes, Multi-Layer Perceptron, k-nearest neighbor, Random Forest, AdaBoost, gradient boosting, dan histogram gradient boosting. Metrik evaluasi, termasuk presisi, recall, skor F1, akurasi, dan AUC, menghasilkan hasil yang mengesankan: 93,90%, 98,83%, 96,30%, 96,25%, dan 0,9916 untuk dataset I; 94,17%, 99,05%, 96,54%, 96,48%, dan 0,9931 untuk dataset II; dan 89,81%, 82,40%, 85,91%, 86,66%, dan 0,9274 untuk dataset III. Temuan ini menunjukkan bahwa model prediksi yang diusulkan berpotensi memfasilitasi deteksi dini penyakit kardiovaskular, sehingga meningkatkan strategi pencegahan dan meningkatkan luaran pasien.
Akhirnya diperoleh kesimpulan bahwa model yang diusulkan memprediksi penyakit kardiovaskular dengan sangat baik pada himpunan data besar untuk masalah klasifikasi biner. Namun, model ini belum dievaluasi pada himpunan data yang lebih kecil atau untuk masalah klasifikasi lainnya, seperti klasifikasi multikelas dan multilabel. Oleh karena itu, penelitian selanjutnya akan berfokus pada analisis model kami pada himpunan data yang lebih kecil dengan menggunakan hiperparameter dan teknik yang sama. Selain itu, model yang diusulkan juga akan dinilai untuk tantangan klasifikasi multikelas dan multilabel. Setelah model tersebut secara konsisten mengidentifikasi penyakit kardiovaskular secara akurat, model tersebut akan dianggap sebagai alat yang andal untuk memprediksi penyakit kardiovaskular.
Penulis: Prof. Dr. Nur Chamidah, S.Si., M.Si.
Informasi lengkap (detail) dari penelitian ini dapat dilihat pada tulisan kami di laman:
https://doi.org/10.3390/math13132194
Fitriyani, N.L.; Syafrudin, M.; Chamidah, N.; Rifada, M.; Susilo, H.; Aydin, D.; Qolbiyani, S.L.; Lee, S.W. (2025). A Novel Approach Utilizing Bagging, Histogram Gradient Boosting, and Advanced Feature Selection for Predicting the Onset of Cardiovascular Diseases. Mathematics 13(13), 2194. DOI: 10.3390/math13132194.





