Sistem pencarian informasi merupakan sistem yang dapat mengembalikan dokumen relevan kepada pengguna. Tantangan dalam sistem pencarian informasi, yaitu ketidaksesuaian antara kata kunci pengguna dengan istilah yang terdapat dalam dokumen, sehingga hasil pencarian sering kali tidak relevan. Melalui metode yang dikembangkan, sistem pencarian dapat memahami makna kata yang dimasukkan pengguna, bukan hanya mencocokkan kata.
Dalam penelitian ini, basis pengetahuan dari Wikipedia digunakan untuk membangun model graf yang menggambarkan hubungan semantik antar kata. Setiap kata direpresentasikan sebagai simpul (node), sedangkan hubungan maknanya digambarkan sebagai sisi (edge) yang dihitung menggunakan algoritma Word2Vec. Dengan model ini, sistem mampu memperluas konteks pencarian menggunakan kata-kata yang memiliki makna serupa sehingga hasil pencarian menjadi lebih relevan.
Metode ini diuji menggunakan dua jenis data, yaitu monolingual dalam bahasa Inggris pada domain medis dan cross-lingual (lintas bahasa) antara bahasa Indonesia dan Arab pada data sosial-keagamaan. Hasil pengujian menunjukkan peningkatan signifikan, dengan tingkat recall mencapai 78,6% pada data monolingual dan tingkat keberhasilan sebesar 67% pada pengujian success rate 10 documents (SR10K) pada data cross-lingual.
Penelitian ini memiliki potensi besar untuk diterapkan di dunia akademik, terutama dalam membantu mahasiswa dan peneliti menemukan referensi ilmiah yang relevan meskipun berasal dari sumber berbahasa asing. Sistem pencarian berbasis semantik ini mampu menerjemahkan konteks pertanyaan dan memberikan hasil yang relevan lintas bahasa.
Keberhasilan riset ini menjadi bukti kolaborasi antara UNAIR dan ITS dalam bidang kecerdasan buatan dan Natural Language Processing. Pengembangan metode yang akan dilakukan adalah menggabungkan graph matching dan deep learning untuk memperluas penerapannya pada berbagai domain seperti kesehatan, hukum Islam, dan sosial-humaniora. Dengan penggabungan antara teknologi semantik dan pembelajaran mesin, sistem pencarian informasi diharapkan dapat menjadi lebih cerdas, relevan, dan bermanfaat luas bagi masyarakat.
Penulis: Dr. Maryamah, S.Kom.
Link: https://ieeexplore.ieee.org/abstract/document/11160808





