Klik bait merupakan strategi umum yang digunakan oleh situs berita untuk menghasilkan klik dan pendapatan dari iklan online. Namun, pendekatan ini juga telah menyebabkan penurunan kredibilitas sumber berita yang mapan. Untuk mengatasi masalah ini, tim peneliti mengembangkan sebuah jaringan saraf menggunakan model bahasa terlatih sebelumnya multilingual bidirectional encoder representations from transformers (BERT) untuk mendeteksi judul klik bait.
Tim menggunakan dataset 6.632 judul sebagai data latih untuk klasifier, yang menggabungkan 100 node-hidden layer dengan pengklasifikasi sigmoid. Hasilnya cukup mengesankan, dengan skor akurasi 0,914, skor F1 0,914, skor presisi 0,916, dan area di bawah kurva karakteristik operasi pengguna (ROC-AUC) sebesar 0,92. Penggunaan multilingual BERT dalam tugas klasifikasi teks Bahasa Indonesia juga diuji, dengan potensi untuk lebih ditingkatkan.
Penelitian ini memiliki implikasi sosial yang penting, karena penyebaran judul klik bait telah menyebabkan penyebaran informasi yang salah dan erosi kepercayaan terhadap sumber berita yang sah. Deteksi judul klik bait dapat membantu mencegah penyebaran informasi yang salah dan mengembalikan kepercayaan pada sumber berita yang mapan. Namun, ada juga batasan pada pendekatan ini, karena beberapa judul klik bait mungkin tidak terdeteksi oleh jaringan saraf.
Secara keseluruhan, penelitian ini menyoroti potensi teknik pembelajaran mesin dalam memerangi penyebaran informasi yang salah dan mengembalikan kepercayaan pada sumber berita yang sah. Dengan pengembangan dan penyempurnaan lebih lanjut, penggunaan jaringan saraf untuk mendeteksi judul klik bait dapat menjadi alat penting dalam perang melawan berita palsu dan erosi kepercayaan terhadap media.
Penulis: Muhammad Noor Fakhruzzaman, Sa’idah Zahrotul Jannah, Ratih Ardiati Ningrum, Indah Fahmiyah
Artikel: Flagging clickbait in Indonesian online news websites using fine-tuned transformershttp://doi.org/10.11591/ijece.v13i3.pp2921-2930