Indonesia tengah bersiap menyambut bonus demografi pada tahun 2030, di mana jumlah penduduk usia produktif diproyeksikan mendominasi struktur demografi nasional. Bonus ini diyakini menjadi peluang emas bagi pertumbuhan ekonomi. Namun, harapan ini bisa pupus apabila kualitas sumber daya manusia, khususnya anak-anak, terganggu oleh masalah gizi kronis seperti stunting.
Stunting merupakan kondisi gagal tumbuh pada anak akibat kekurangan gizi kronis dan infeksi berulang, terutama dalam 1000 hari pertama kehidupan. Menurut WHO, anak dikategorikan stunting jika tinggi badan menurut usia berada di bawah dua standar deviasi kurva pertumbuhan WHO. Di Indonesia, prevalensi stunting secara nasional memang menurun, namun di tingkat provinsi seperti Jawa Timur, angka ini masih memprihatinkan. Pemerintah Provinsi Jawa Timur menargetkan prevalensi stunting turun hingga 13,5% pada 2024—lebih ambisius dari target nasional sebesar 14%.
Dalam konteks itulah, pemanfaatan teknologi informasi dan kecerdasan buatan menjadi sangat relevan. Penelitian yang dilakukan oleh Teguh Herlambang dan tim berupaya membandingkan dua algoritma klasifikasi—Naïve Bayes dan K-Nearest Neighbor (KNN)—untuk memprediksi wilayah dengan prevalensi stunting tertinggi di Jawa Timur. Tujuan akhirnya adalah memberikan alat bantu bagi pengambil kebijakan dalam melakukan intervensi yang lebih tepat sasaran.
Penelitian ini menggunakan pendekatan komputasi prediktif berbasis data sekunder dari Dinas Kesehatan Provinsi Jawa Timur. Dataset mencakup periode Januari 2019 hingga Desember 2022, dengan variabel utama:
- Prevalensi bayi lahir dengan berat badan rendah (BBLR)
- Persentase ibu hamil yang mengonsumsi tablet tambah darah (TTD)
- Status stunting bulanan per wilayah
Data yang digunakan berasal dari 6 wilayah yang memiliki prevalensi stunting tertinggi, yaitu: Kota Pasuruan, Kabupaten Probolinggo, Kota Batu, Kabupaten Ponorogo, dan Kabupaten Pacitan.
Setelah dilakukan pembersihan data (data cleaning), peneliti memisahkan data menjadi data latih (training) dan data uji (testing) dalam dua skenario:
- 75% data latih dan 25% data uji
- 87,5% data latih dan 12,5% data uji
Kedua metode—Naïve Bayes dan KNN—diimplementasikan menggunakan perangkat lunak RapidMiner, dengan pengukuran kinerja berdasarkan dua metrik utama:
- Akurasi (accuracy): persentase prediksi yang benar
- Root Mean Square Error (RMSE): ukuran error rata-rata antara hasil prediksi dan data aktual
Untuk KNN, eksperimen dilakukan dengan nilai k yang berbeda: 3, 5, dan 7.
Hasil simulasi menunjukkan bahwa algoritma Naïve Bayes unggul dibanding KNN dalam semua skenario, baik dari sisi akurasi maupun RMSE. Rinciannya sebagai berikut:
Akurasi
| Algoritma | Simulasi 1 (75:25) | Simulasi 2 (87.5:12.5) |
| Naïve Bayes | 83,33% | 66,67% |
| KNN (k=3) | 50,00% | 33,33% |
| KNN (k=5) | 58,33% | 33,33% |
| KNN (k=7) | 58,33% | 33,33% |
RMSE (semakin kecil semakin baik)
| Algoritma | Simulasi 1 | Simulasi 2 |
| Naïve Bayes | 0,382 | 0,469 |
| KNN (k=3) | 0,547 | 0,698 |
| KNN (k=5) | 0,504 | 0,653 |
| KNN (k=7) | 0,510 | 0,654 |
Dari data tersebut, dapat dilihat bahwa Naïve Bayes menghasilkan prediksi yang lebih akurat dan stabil dibanding KNN. KNN sendiri lebih sensitif terhadap nilai k dan cenderung terpengaruh oleh distribusi data yang tidak merata.
Penelitian ini membuktikan bahwa Naïve Bayes merupakan metode yang lebih andal dalam memprediksi wilayah dengan prevalensi stunting tinggi di Provinsi Jawa Timur. Dengan akurasi hingga 83,33% dan RMSE yang relatif rendah, metode ini mampu memberikan gambaran yang cukup tepat mengenai kondisi stunting berdasarkan variabel-variabel kunci seperti BBLR dan konsumsi TTD oleh ibu hamil.
Keunggulan utama Naïve Bayes terletak pada kesederhanaannya, kecepatan dalam proses training, serta kemampuannya menangani data kategorikal maupun numerik. Hal ini menjadikannya sangat cocok digunakan dalam sistem pemantauan kesehatan masyarakat, khususnya di wilayah dengan ketersediaan data terbatas.
Sebaliknya, KNN memiliki performa yang lebih rendah karena sangat tergantung pada jumlah k dan tidak memiliki proses pembelajaran (lazy learner), sehingga kurang optimal dalam konteks prediksi berbasis data demografi dan kesehatan yang fluktuatif.
Saran
Berdasarkan temuan dalam penelitian ini, terdapat beberapa rekomendasi yang dapat diterapkan oleh berbagai pihak, khususnya instansi pemerintah dan tenaga kesehatan. Pertama, perlu adanya penguatan sistem informasi kesehatan yang terintegrasi, di mana metode prediktif seperti Naïve Bayes dapat diterapkan dalam dashboard pemantauan stunting berbasis real-time. Dengan demikian, pengambilan keputusan dapat dilakukan secara lebih cepat dan akurat untuk mencegah peningkatan kasus stunting di wilayah berisiko tinggi. Kedua, hasil prediksi yang diperoleh dari model ini dapat dijadikan dasar perencanaan intervensi program gizi, seperti distribusi tablet tambah darah (TTD), penyuluhan gizi untuk ibu hamil, serta peningkatan akses pelayanan kesehatan anak. Ketiga, model prediktif ini sebaiknya dikembangkan lebih lanjut dengan memasukkan variabel sosial-ekonomi lain, seperti tingkat pendidikan ibu, kondisi sanitasi, dan akses air bersih, untuk memperkaya informasi dan meningkatkan akurasi prediksi.
Keempat, tenaga kesehatan di tingkat Puskesmas perlu dibekali dengan pelatihan literasi data dan keterampilan interpretasi hasil prediksi. Dengan begitu, mereka tidak hanya menjadi pengguna data, tetapi juga mampu merancang strategi intervensi berbasis bukti (evidence-based planning). Terakhir, disarankan agar dikembangkan aplikasi mobile sederhana yang dapat diakses oleh pemangku kebijakan di daerah, bahkan oleh masyarakat umum. Aplikasi tersebut dapat menampilkan hasil prediksi stunting per wilayah dalam format visual yang mudah dipahami, sehingga meningkatkan kesadaran publik dan memperkuat kolaborasi lintas sektor dalam upaya percepatan penurunan stunting. Dengan implementasi saran-saran ini, diharapkan sistem prediksi berbasis machine learning dapat menjadi bagian integral dalam kebijakan kesehatan masyarakat yang lebih adaptif dan responsif.
Penulis: Aji Akbar Firdaus
Informasi detail dari riset ini dapat dilihat pada tulisan kami di:
https://www.scopus.com/inward/record.uri?eid=2-s2.0-85216940734&doi=10.30598%2fbarekengvol18iss4pp2153-2164&partnerID=40&md5=630f081ed7ad0561bd5724600418eb0e
Herlambang T., Asy’ari V., Rahayu R.P., Firdaus A.A., Juniarta N.: COMPARISON OF NAVE BAYES AND K-NEAREST NEIGHBOR MODELS FOR IDENTIFYING THE HIGHEST PREVALENCE OF STUNTING CASES IN EAST JAVA. Barekeng, Volume 18, Issue 4, Pages 2153-2164, 2025 Top of FormBottom of Form





