Analisis Pasien Diabetes dengan Ekstraksi Fitur Principal Component Analysis (PCA) dan K-Means Clustering

artikel ilmiah populer, Artikel Ilmiah Populer

Analisis Pasien Diabetes dengan Ekstraksi Fitur Principal Component Analysis (PCA) dan K-Means Clustering

unairnews

Mei 26, 2026

1:29 pm

Perkembangan teknologi komunikasi dan informasi dalam dekade terakhir telah mendorong pemanfaatan sistem digital di berbagai sektor, termasuk sektor kesehatan. Penggunaan electronic medical record (EMR), electronic health record (EHR), perangkat medis, dan aplikasi kesehatan menghasilkan data kesehatan digital dalam jumlah besar yang dapat dimanfaatkan untuk mendukung pengambilan keputusan berbasis pasien. Data seperti hasil laboratorium dan laporan medis memungkinkan pengelolaan penyakit kronis, termasuk diabetes, menjadi lebih efektif melalui analisis data.

Diabetes merupakan penyakit metabolik dengan jumlah penderita yang terus meningkat secara global. Diperkirakan terdapat 463 juta orang dengan diabetes di seluruh dunia pada tahun 2019, dan jumlah ini diproyeksikan akan mencapai 578 juta pada tahun 2030. Menurut Badan Pusat Statistik Indonesia, pada tahun 2003 terdapat 8,2 juta penderita diabetes di wilayah pedesaan di Indonesia. Diabetes tipe 2 merupakan jenis yang paling dominan, mencakup lebih dari 90% kasus. Karakteristik pasien yang beragam menyebabkan pengelolaan menjadi lebih sulit. Tingginya biaya pengobatan serta risiko komplikasi serius menjadikan diabetes sebagai fokus penting dalam penelitian, termasuk dalam prediksi dan klasifikasi menggunakan teknik machine learning.

Untuk memahami pola dan karakteristik pasien diabetes, teknik data mining seperti clustering sering digunakan. Clustering merupakan metode untuk mengelompokkan data ke dalam beberapa klaster berdasarkan kemiripan karakteristik. Metode seperti k-means dapat digunakan untuk mengelompokkan pasien, sedangkan Principal Component Analysis (PCA) berfungsi untuk mengurangi dimensi data serta mempermudah visualisasi. Kombinasi k-means dan PCA dalam penelitian ini bertujuan menghasilkan pola data yang lebih sederhana dan informatif, sehingga dapat mendukung perencanaan penanganan diabetes yang lebih tepat dan terarah.

Data pasien diabetes dalam penelitian ini diperoleh dari puskesmas di salah satu kabupaten di Provinsi Jawa Timur, Indonesia. Tahapan penelitian meliputi preprocessing data, reduksi dimensi menggunakan PCA, dan proses clustering menggunakan algoritma k-means. Hasil penelitian menunjukkan bahwa penggunaan PCA mampu meningkatkan kualitas klastering. Kombinasi PCA dan k-means meningkatkan nilai evaluasi klastering sekitar 20%. Peningkatan ini terjadi karena PCA mampu mengurangi dimensi data dengan tetap mempertahankan variansi utama, sehingga struktur klaster menjadi lebih jelas serta mengurangi kompleksitas dan noise pada data.

Hasil clustering menghasilkan dua klaster, dengan sekitar 90% data berada pada klaster pertama. Hal ini menunjukkan bahwa dataset cenderung homogen. Perbedaan utama antara kedua klaster terletak pada variabel kategorikal BMI (Body Mass Index). Klaster pertama didominasi oleh pasien dengan BMI normal, sedangkan klaster kedua didominasi oleh pasien dengan kondisi overweight. Sementara itu, berdasarkan variabel diagnosis, tidak terdapat perbedaan signifikan antara kedua klaster, karena keduanya terdiri dari pasien diabetes non-insulin-dependent dengan atau tanpa komplikasi non-spesifik.

Berdasarkan hasil tersebut, dapat disimpulkan bahwa dataset yang digunakan relatif homogen karena berasal dari layanan kesehatan tingkat pertama, yang umumnya menangani pasien rawat jalan dengan kondisi rutin. Pasien biasanya dirujuk ke layanan kesehatan tingkat lanjut apabila terjadi perkembangan penyakit yang lebih serius. Analisis klaster ini memberikan pemahaman mengenai karakteristik pasien diabetes, sehingga dapat menjadi dasar dalam penyusunan strategi penanganan yang lebih tepat dan terarah. Sebagai contoh, edukasi terkait pola hidup sehat dapat difokuskan pada pasien diabetes dengan kondisi overweight.

Informasi detail dari riset ini dapat dilihat pada link berikut:

https://pubs.aip.org/aip/acp/article-abstract/3326/1/080040/3382191/Analyzing-diabetes-patient-data-through-k-means?redirectedFrom=fulltext

Authors: Endah Purwanti; Fatmawati; Rimuljo Hendradi