Dunia baru saja menghadapi wabah virus corona atau COVID-19. Berbagai negara telah menerapkan kebijakan lockdown untuk mengurangi penyebaran virus COVD-19 ini. Di Indonesia sendiri, pemerintah menerapkan kebijakan karantina mandiri dalam upaya untuk mengurangi penyebaran virus corona. Kebijakan tersebut melarang masyarakat untuk melakukan kerumunan. Dalam bidang Pendidikan, untuk menyikapi hal tersebut, Kemendikbud menerapkan kebijakan sekolah online agar peserta didik tetap mendapatkan haknya untuk memperoleh pendidikan. Pembelajaran online adalah pembelajaran dengan peran media online sebagai sumber terbanyak dalam latihan atau pembelajaran. Masyarakat menganggap bahwa kebijakan yang dikeluarkan oleh Kemendikbud ini efektif untuk mengurangi penyebaran virus corona dan bermanfaat karena membuat masyarakat semakin mengerti akan teknologi. Akan tetapi seiring berjalannya waktu, masyarakat mulai mengeluhkan berbagai dampak yang mereka rasakan, diantaranya masalah teknis seperti biaya kuota, hingga masalah psikologis seperti merasa jenuh dan stress dengan adanya sekolah online ini. Masyarakat kebanyakan mengekspresikan keluhan atau masalahnya tersebut melalui tulisan di media sosial, salah satunya adalah media sosial Twitter. Dalam sudut pandang statistika, keluhan pengguna Twitter ini merupakan data yang dapat diolah menjadi informasi yang berguna bagi pemerintah. Oleh karena itu diperlukan olah data berupa identifikasi permasalahan pembelajaran online. Harapannya, bisa menghasilkan informasi yang dapat dijadikan sebagai rujukan untuk tindak lanjut dinas terkait dalam menentukan kebijakan pembelajaran online dan memberikan solusi demi perbaikan sistem pembelajaran online.
Identifikasi terkait data yang berupa teks atau dokumen dapat dilakukan dengan metode text mining. Dalam tulisan ini, untuk mengidentifikasi permasalahan pembelajaran online melalui media Twitter tersebut digunakan pendekatan algoritma Support Vector Machine (SVM). Algoritma SVM dilakukan dengan cara mencari hyperplane terbaik sebagai pemisah diantara dua kategori data.
Data yang digunakan pada penelitian ini sebanyak 549 dokumen yang diperoleh dari tweets mengenai permasalahan pembelajaran online. Pengambilan data dilakukan dengan teknik website crawling dengan menggunakan bantuan Application Program Interface (API), dengan periode pengambilan pada bulan September 2020. Proses crawling dilakukan menggunakan Open Source Software – R dengan bantuan paket TwitterR. Secara garis besar, permasalahan pembelajaran online dikategorikan dalam permasalahan psikologis dan psikis. Berdasarkan hasil labelling secara manual, terdapat 52% dari total dokumen merupakan permasalahan psikologis dan 48% dokumen merupakan permasalahan teknis.
Untuk dapat dianalisis, data teks yang diperoleh melalui crawling terlebih dahulu harus dilakukan preprocessing. Tahap preprocessing meliputi Cleaning, Case folding, Spelling normalization, Tokenizing, Stowords removal, dan Stemming. Hasil akhir dari preprocessing berupa kata-kata dasar dan penting dari masing-masing dokumen yang dijadikan sebagai dasar untuk mengklasifikasikan dokumen ke salah satu kelas atau kategori.
Hasil penelitian memberikan rata-rata akurasi klasifikasi pada data training sebesar 99,811%, sedangkan rata-rata akurasi klasifikasi pada data testing sebesar 90,3%. Selain itu dari hasil uji Press’Q diketahui bahwa model yang digunakan sudah stabil untuk memprediksi data tweets baru. Hal ini menunjukkan bahwa metode Support Vector Machine (SVM) mampu mengklasifikasikan data permasalahan pembelajaran online dengan sangat baik.
Penulis: Dr. Toha Saifudin
Informasi detil dari penelitian ini dapat dilihat pada tulisan kami di: https://aip.scitation.org/doi/pdf/10.1063/5.0104576
Derbi Wulan Fitri, Toha Saifudin, and Nur Chamidah, 2023. Classification of Online School Problems from tweets on Twitter using Support Vector Algorithm, AIP Conference Proceedings 2554,030016 (2023). doi: https://doi.org/10.1063/5.0104576





