Universitas Airlangga Official Website

Evaluasi dan Klasterisasi Distribusi Probabilitas pada Data Lingkungan melalui Antarmuka Grafis MATLAB

Ilustrasi Fitoplankton (Sumber: Forest Digest)
Ilustrasi Fitoplankton (Sumber: Forest Digest)

Model distribusi probabilitas memainkan peran penting dalam berbagai analisis ilmiah, khususnya pada data lingkungan yang bersifat kompleks dan heterogen. Salah satu contohnya adalah konsentrasi klorofil di laut, yang digunakan sebagai indikator kesehatan ekosistem laut dan keberadaan fitoplankton. Namun, dalam praktiknya, menentukan distribusi probabilitas yang paling sesuai untuk data lingkungan bukanlah hal yang mudah.

Penelitian terbaru dari Universitas Airlangga yang dikembangkan oleh Felix Reba, Dr. Toha Saifudin, dan Dr. Rimuljo Hendradi, memperkenalkan sebuah sistem antarmuka grafis berbasis MATLAB (GUI) yang dapat digunakan untuk mengevaluasi kecocokan distribusi probabilitas dan mengelompokkan distribusi berdasarkan performa statistiknya.

Mengapa Ini Penting?

Menurut para peneliti, metode klasik seperti uji Kolmogorov-Smirnov (KS) atau Anderson-Darling (AD) sering memberikan hasil yang tidak konsisten ketika digunakan pada data lingkungan yang kompleks. Padahal, informasi yang akurat mengenai bentuk distribusi data sangat krusial untuk prediksi dan pengambilan keputusan, misalnya dalam memantau tingkat eutrofikasi laut.

Melalui pendekatan gabungan antara evaluasi goodness-of-fit, clustering, dan mixture modeling, penelitian ini mampu mengidentifikasi model statistik yang lebih stabil dan adaptif terhadap keragaman data.

Integrasi Visual dan Otomatisasi

GUI yang dikembangkan menggunakan MATLAB ini menyatukan seluruh alur analisis ke dalam satu aplikasi terpadu. Mulai dari pengambilan data klorofil dari Copernicus Marine Service, estimasi parameter distribusi, pengujian kecocokan, pemilihan model dengan kriteria informasi (AIC, BIC, AICc, CAIC, HQC), hingga penerapan model campuran dengan pembobotan berdasarkan hasil uji KS – semuanya dapat dilakukan dalam antarmuka visual yang ramah pengguna. “Dengan pendekatan ini, pengguna tidak perlu lagi melakukan analisis secara manual atau menggunakan skrip terpisah. Prosesnya lebih transparan, terstruktur, dan mudah direproduksi,”

Data dan Hasil

Penelitian menggunakan data klorofil dari Laut Hitam dengan ukuran sampel yang bervariasi (n=17, 18, 29, dan 56). Sebanyak 17 distribusi probabilitas diuji dalam studi ini, yaitu: Exponential, Gamma, Log Normal, Logistic, Log Logistic, Normal, Rayleigh, Generalized Extreme Value (GEV), Weibull, Rician, Birnbaum-Saunders, Extreme Value, Half Normal, Inverse Gaussian, Nakagami, Stable, dan t Location Scale.

Hasilnya menunjukkan bahwa 14 distribusi secara konsisten lulus uji kecocokan, sementara 3 lainnya (Exponential, Rayleigh, dan Half-Normal) ditolak karena nilai statistik yang tinggi dan p-value yang rendah. Ketika distribusi ini dikelompokkan menggunakan algoritma K-Means++, terbentuk empat klaster yang stabil dengan nilai Silhouette mendekati 1 dan Davies-Bouldin Index (DBI) sangat rendah.

Model Campuran: Solusi untuk Data Kompleks

Peneliti kemudian membangun model distribusi campuran, di mana kontribusi masing-masing distribusi ditentukan oleh performa uji KS-nya. Model ini menunjukkan hasil yang sangat baik, bahkan mengungguli distribusi tunggal pada sebagian besar ukuran sampel, terutama dalam hal Root Mean Square Error (RMSE) dan Kullback-Leibler Divergence (KL).

Dengan pendekatan ini, model campuran tidak hanya menangkap bentuk umum distribusi data, tapi juga keunikannya pada bagian ekor dan puncak distribusi – hal yang sulit dicapai oleh satu distribusi saja.

Luasnya Aplikasi

Metodologi ini kemudian diuji pada variabel lingkungan lainnya seperti Colored Dissolved Organic Matter (CDOM) dan salinitas air laut. Hasilnya konsisten, membuktikan bahwa pendekatan ini dapat digunakan secara umum dalam bidang oseanografi, lingkungan, dan analisis data ekologi lainnya.

Kontribusi terhadap SDGs

Penelitian ini juga mendukung Sustainable Development Goals (SDGs) 14: Life Below Water, dengan menyediakan alat statistik yang lebih akurat untuk memantau kualitas ekosistem laut secara berkelanjutan. GUI ini bukan hanya alat bantu analisis, tapi juga jembatan antara ilmu statistik dan pelestarian lingkungan,”.

Penulis: Dr. Toha Saifudin, M.Si.

Informasi detail terkait artikel ini dapat dilihat pada: https://doi.org/10.1016/j.mex.2025.103586