Universitas Airlangga Official Website

Model Prediksi Penyakit Kronis dengan Mengintegrasikan DBSCAN, SMOTE-ENN, dan Random Forest

Foto by Anlene

Penyakit jantung adalah penyakit kronis utama yang menjadi penyebab utama kecacatan dan kematian di seluruh dunia. Organisasi Kesehatan Dunia (WHO) melaporkan, penyakit jantung memberikan kontribusi sekitar 30% dari semua kematian global dan diperkirakan akan meningkat menjadi sekitar 22 juta pada tahun 2030. Di Amerika, penyebab utama kematian disebabkan oleh penyakit jantung. Konsumsi tembakau dan alkohol, aktivitas fisik yang tidak mencukupi, dan diet yang buruk adalah semua faktor yang berperan dalam timbulnya penyakit jantung. Faktor-faktor perilaku ini mungkin berdampak pada kesehatan individu, bermanifestasi sebagai glukosa darah tinggi, tekanan darah, dan kolesterol, serta obesitas atau kelebihan berat badan. Pusat Pengendalian Penyakit dan Pencegahan Amerika melaporkan, beberapa kondisi kesehatan seperti diabetes, hipertensi, obesitas, dan kadar kolesterol darah yang tidak sehat dapat sangat meningkatkan risiko penyakit jantung.

Selain penykit jantung, T2D juga merupakan penyakit kronis yang dikategorikan sebagai penyakit paling mematikan di dunia yang memberikan kontribusi tinggi pada kematian dini dengan sekitar 41 juta per tahun. Jumlah kematian yang disebabkan oleh diabetes adalah sekitar 71% dari seluruh kematian global. T2D merupakan kondisi ketidakmampuan tubuh dalam menggunakan insulin yang dihasilkan. T2D juga merupakan faktor risiko utama dan memiliki hubungan dengan penyakit jantung.

Seiring dengan meningkatnya kekhawatiran akan risiko penyakit jantung dan T2D, model ML telah dimanfaatkan sebagai salah satu alternatif atau solusi dalam mendeteksi penyakit tersebut. Model prediksi penyakit kronis yang diusulkan yaitu mengintegrasikan DBSCAN, SMOTE-ENN, dan Random Forest. Model ini dikembangkan untuk menawarkan dan memberikan model prediksi yang efisien dengan prediksi kinerja tinggi untuk penampilan HD dan T2D berdasarkan kondisi individu saat ini.

Skema prediksi penyakit kronis yang diusulkan meliputi pra-pemrosesan data untuk eliminasi nilai yang hilang dan transformasi data. Kemudian untuk mendeteksi keberadaan outlier digunakan metode DBSCAN untuk menghilangkan noise atau outlier pada dataset. Setelah itu, metode SMOTE-ENN diterapkan untuk membuat kelas minoritas dan kelas mayoritas dari data dalam porsi yang sama. Langkah selanjutnya adalah menggunakan algoritma ML berbasis hutan acak untuk mengklasifikasikan dataset untuk pelatihan dan menghasilkan model prediksi penyakit kronis. Terakhir, pada tahap terakhir dilakukan perbandingan hasil dengan model machine learning yang ada, seperti gaussian naive bayes (GNB), regresi logistik (LR), pohon keputusan (DT), multilayer perceptron (MLP), dan support vector machine (SVM).

Penulis: Norma Latif Fitriyani, Muhammad Syafrudin, Ganjar Alfian, Chuan-kai Yang, Jongtae Rhee, Siti Maghfirotul Ulyah

Link: Chronic Disease Prediction Model Using Integration of DBSCAN, SMOTE-ENN, and Random Forest

https://ieeexplore.ieee.org/document/9888806