Universitas Airlangga Official Website

Peningkatan Akurasi Diagnosis Penyakit Jantung dengan Machine Learning Berbasis Kernel Support Vector Machine

Estimator Spline dalam Model Regresi Logistik Ordinal Nonparametrik untuk Memprediksi Risiko Serangan Jantung

Menurut data yang dirilis oleh World Health Organization (WHO) pada tahun 2019, penyakit kardiovaskular (CVD) menjadi penyebab utama kematian di dunia, dengan estimasi 17,9 juta kematian. Penyakit ini merupakan kondisi yang memengaruhi jantung dan pembuluh darah, yang dapat menghambat aliran darah serta berpotensi menyebabkan serangan jantung.

Langkah awal dalam mengurangi angka kematian akibat CVD adalah dengan melakukan diagnosis dini berdasarkan tanda, gejala, serta pemeriksaan fisik pasien. Namun, diagnosis secara konvensional dapat menghadapi tantangan akibat kompleksitas data yang besar, yang berpotensi menyebabkan kesalahan dalam analisis medis. Untuk mengatasi permasalahan ini, algoritma machine learning mulai diterapkan dalam proses diagnosis guna meningkatkan akurasi dan efisiensi.

Sebuah penelitian yang dilakukan oleh Gupta et al. (2021) mengkaji berbagai algoritma machine learning dalam diagnosis penyakit jantung, seperti Logistic Regression, Support Vector Machine (SVM), Naïve Bayes, Decision Tree, K-Nearest Neighbors (KNN), dan Random Forest. Hasil penelitian menunjukkan bahwa Logistic Regression memiliki tingkat akurasi tertinggi sebesar 92,30%, disusul oleh SVM dengan akurasi 91,20%. Berdasarkan hasil tersebut, penelitian lebih lanjut kini berfokus pada optimalisasi algoritma SVM dengan berbagai jenis kernel untuk meningkatkan akurasi prediksi penyakit jantung.

Penggunaan SVM dengan kernel linear, radial basis function (RBF), dan polynomial menjadi sorotan dalam penelitian ini, karena kemampuannya dalam memisahkan data dengan mendeteksi hyperplane yang optimal. Dengan efisiensi komputasi yang tinggi, algoritma ini diharapkan dapat menangani data berdimensi besar dan memberikan hasil yang lebih akurat dalam diagnosis penyakit jantung.

Penelitian ini berfokus pada prediksi penyakit jantung menggunakan SVM dengan tiga jenis kernel, yaitu Kernel SVM Linear, Kernel SVM Polynomial, dan Kernel SVM RBF. Penelitian ini melibatkan beberapa tahap, termasuk pengumpulan data, eksplorasi data, pemrosesan data, serta pemisahan data menjadi data latih dan data uji dengan rasio 70:30. Penelitian ini menggunakan 1988 Public Health Dataset, yang mencakup empat basis data, salah satunya adalah Cleveland, yang hingga saat ini banyak digunakan oleh peneliti di bidang Machine Learning. Data tersebut menggunakan 13 variabel sebagai fitur dan 1 variabel sebagai target untuk melakukan klasifikasi. Variabel tersebut adalah age, sex, Chest pain Type (Cp), Resting blood pressure (Testbps), Serum Cholesterol (Chol), Fasting Blood Sugar (Fbs), Resting electrocardiographic result (Restecg), Maximum Heart Rate (Thalach), Does the patient experience angina during physical activity? (Exang), ST depression due exercise (Oldpeak), The slope of the peak exercise ST (Slope), Number of major vessels (Ca), The patient’s thalassemia category (Thal), and Cardiac Disease (Target).

Berdasarkan hasil evaluasi, Kernel SVM Linear menunjukkan performa terbaik dalam mendeteksi penyakit jantung dengan tingkat akurasi 96%. Sementara itu, Kernel SVM Polynomial dan Kernel SVM RBF memiliki akurasi yang lebih rendah, masing-masing sebesar 67% dan 66%. Hasil ini mengindikasikan bahwa Kernel SVM Linear lebih efektif dalam menangani data pada penelitian ini dibandingkan dengan dua jenis kernel lainnya.Model ini (SVM dengan kernel linier) memberikan hasil dengan tingkat akurasi tertinggi sebesar 96%, yang lebih baik dibandingkan model terbaik dalam penelitian sebelumnya, yaitu Linear Regression dengan akurasi 92%. Dengan hasil ini, diharapkan penelitian lebih lanjut dapat menggunakan model SVM ini untuk mendeteksi penyakit lain guna menghasilkan prediksi yang lebih akurat pada berbagai dataset.

Penulis: Indah Werdiningsih

Artikel dapat diakses pada tautan:

https://pubs.aip.org/aip/acp/article-abstract/3248/1/040015/3332027/Heart-disease-diagnose-using-support-vector?redirectedFrom=fulltext