Universitas Airlangga Official Website

Studi Perbandingan Pendekatan Pembelajaran Tradisional dan Pembelajaran Mendalam untuk Klasifikasi Multikelas Berita Pariwisata

Sumber: JKT Gadget
Sumber: JKT Gadget

Dalam penelitian ini, dilakukan perbandingan antara model klasifikasi teks menggunakan SVM dan ANN berdasarkan waktu dan kinerjanya. Kedua model tersebut juga diuji dalam skenario dengan dan tanpa penggunaan seleksi fitur.

Dengan penerapan hyperparameter tuning pada SVM terhadap parameter C, gamma, dan jenis kernel yang digunakan, menunjukkan bahwa kernel polinomial memiliki nilai F1-score tertinggi sebesar 97,73% dengan rata-rata waktu komputasi 90,35 detik. Pada kernel RBF, nilai F1-score tertinggi adalah 96,19% dengan rata-rata waktu komputasi 117,26 detik. Sedangkan pada kernel linear, nilai F1-score menurun sebesar 4,2% menjadi 93,53%, namun waktu komputasinya lebih singkat, yaitu 86,68 detik.

Penggunaan seleksi fitur IG berhasil mengurangi waktu komputasi sebesar 10 detik menjadi 80,69 detik dengan tetap mempertahankan nilai F1-score sebesar 97,72%. Sementara itu, penggunaan seleksi fitur ANOVA, dengan tetap mempertahankan F1-score sebesar 97,71%, mampu mengurangi rata-rata waktu komputasi menjadi 71,87 detik. Waktu komputasi ini hingga 20 detik lebih cepat dibandingkan tanpa seleksi fitur.

Hasil klasifikasi menggunakan ANN dengan learning rate 0,001, 2 hidden layer, optimizer Adam, fungsi aktivasi ReLU pada hidden layer, fungsi aktivasi Softmax pada output layer, dan jumlah epoch sebanyak 10 menghasilkan nilai F1-score sebesar 97% dan waktu komputasi selama 166,87 detik. Penggunaan seleksi fitur berhasil mengurangi waktu komputasi sebesar 20 detik.

Keterbatasan dalam penelitian ini adalah bahwa dataset yang digunakan hanya berasal dari situs berita tertentu, sehingga perbandingan dengan dataset lain yang sudah tersedia dapat dijadikan bahan eksplorasi lebih lanjut untuk kombinasi parameter yang diusulkan.

Dalam penelitian selanjutnya, perbandingan dapat dilakukan dengan metode machine learning atau deep learning yang lebih mutakhir, seperti BERT atau turunan dari ANN, seperti LSTM. Penelitian lanjutan juga  dapat mempertimbangkan  penggunaan fitur embedding dibandingkan TF-IDF untuk menangkap informasi yang lebih relevan terhadap kelas yang ditentukan.

Penulis: Dr. Miswanto, M.Si.

Link: https://scholar.unair.ac.id/en/publications/a-comparative-study-of-traditional-and-deep-learning-approaches-f/