Stroke merupakan salah satu penyebab kematian dan disabilitas utama di dunia. Berdasarkan data dari World Health Organization (WHO), diperkirakan lebih dari 13 juta orang mengalami stroke setiap tahunnya, dengan 5,5 juta kasus berakhir dengan kematian. Untuk mempercepat identifikasi faktor resiko stroke dan pelayanan kesehatan yang lebih responsif, penelitian ini mengeksplorasi penerapan Fuzzy K-Nearest Neighbor (F-KNN) dan Artificial Neural Networks (ANN) untuk prediksi kejadian stroke, dengan fokus pada dampak metode seleksi fitur Chi-Square dan Best First Search (BFS). Metode delsksi fitur digunakan untuk menentukan faktor yang berpengaruh terhadap resiko stroke dari data pasien.
Penelitian ini menggunakan dataset gabungan dari repositori UCI dan Kaggle. Dataset terdiri dari 1270 instance dengan 12 atribut, yaitu usia, jenis kelamin, tekanan darah, gula darah puasa, diabetes, kolesterol, merokok, riwayat keluarga, aritmia, FND, tipe stroke, dan label kelas. Selanjutnya, tahap preprocessing data meliputi pembersihan data dari outlier, penanganan missing values, dan normalisasi. Dataset final dibagi menjadi 70% data latih dan 30% data uji. Pembuatan model klasifikasi menggunakan F-KNN dan ANN dengan seleksi fitur Chi-Square dan BFS.
Berdasarkan hasil evaluasi kinerja, model klasifikasi ANN dengan seleksi BFS mencapai kinerja terbaik dengan akurasi sebesar 97,5%, precision 97,5%, dan recall 97,5%. Hasil ini mengungguli model F-KNN dengan BFS, yang akurasi, precision, dan recall-nya adalah 96,3%. BFS memilih empat fitur optimal, yaitu tekanan darah, kolesterol, FND, dan tipe stroke, sedangkan Chi-Square memilih delapan fitur. Pengurangan fitur ini berdampak pada efisiensi: kompleksitas waktu ANN-BFS (3,9 detik) lebih rendah dari ANN-Chi-Square (17,8 detik), dengan konsumsi memori 114,6 KB vs 342,1 KB.
Keunggulan metode BFS terletak pada kemampuannya memilih fitur-fitur paling relevan secara iteratif. Dari 12 atribut awal seperti usia, tekanan darah, kolesterol, riwayat keluarga, dan kebiasaan merokok, BFS hanya memilih 4 fitur terpenting. Ini membuat sistem lebih cepat dan efisien tanpa mengorbankan akurasi. Sistem prediksi stroke berbasis AI ini diharapkan dapat membantu tenaga medis melakukan intervensi lebih dini dan mengelola risiko stroke lebih baik.
Judul artikel yang dipublikasikan: Machine Learning Stroke Prediction in Smart Healthcare: Integrating Fuzzy K-Nearest Neighbor and Artificial Neural Networks with Feature Selection Techniques.
Link artikel: https://www.sciencedirect.com/org/science/article/pii/S1546221825002152
Link Scopus: https://www.scopus.com/pages/publications/86000369317?origin=resultslist





