Universitas Airlangga Official Website

Kerangka Kerja Baru untuk Penilaian dan Rekomendasi Hotel Preferensi yang Dipersonalisasi

Karena maraknya teknologi informasi dan komunikasi di dunia maya, wisatawan kini semakin mudah mencari ulasan dari wisatawan lain ketika merencanakan pemesanan hotelnya (Ray et al., 2021). Sayangnya, mereka menghadapi kesulitan dalam menentukan hotel mana yang akan dipilih berdasarkan preferensi spesifik mereka. Faktor-faktor seperti lokasi, harga, fasilitas, dan layanan staf dapat sangat mempengaruhi proses pengambilan keputusan. Setiap orang mungkin memprioritaskan aspek yang berbeda, sehingga semakin mempersulit proses seleksi. Misalnya, seorang wisatawan mungkin memprioritaskan harga, lokasi, dan kebersihan, sementara wisatawan lainnya mungkin berfokus pada lokasi dan layanan, tanpa memperhatikan faktor lainnya (Forouzandeh et al., 2022). Sistem rekomendasi telah muncul sebagai salah satu teknologi yang berhasil diusulkan untuk mengatasi masalah ini (Forouzandeh et al., 2020; Wang et al., 2016). Di antara sistem rekomendasi, rekomendasi yang dipersonalisasi mungkin lebih mengakomodasi preferensi pengguna dan meningkatkan kepuasan individu (Zhu et al., 2021). Namun, rekomendasi yang dipersonalisasi menjadi tantangan ketika catatan sejarah pengguna tidak cukup untuk menentukan preferensi mereka. Akibatnya, pendekatan Collaborative Filtering (CF) akhir-akhir ini menjadi alternatif yang paling populer.

Ketersebaran data dan cold start merupakan keterbatasan penting dalam metode CF, sehingga tidak dapat mencapai performa maksimal. Ketersebaran data terjadi ketika jumlah ulasan pengguna sangat kecil dibandingkan dengan jumlah total produk. Di sisi lain, pengguna baru mungkin baru saja memasuki sistem di mana tidak ada preferensi orang lain, yang disebut masalah cold-start (Nadimi-Shahraki dan Bahadorpour, 2014). Faktorisasi matriks (MF) adalah teknik yang lazim dalam rekomendasi berbasis CF, dan sangat bergantung pada matriks pemeringkatan (Koren et al., 2009). MF tidak efektif untuk masalah cold-start dengan distribusi rating matriks yang tidak merata. Akibatnya, rekomendasi lintas domain simetris (Zhang et al., 2017) diberikan untuk mengurangi kelangkaan data di domain target dengan memanfaatkan data dari domain sumber.

Rekomendasi lintas domain terbaru sering kali berfokus pada pemanfaatan item pemeringkatan untuk menangkap kesan umum layanan hotel (Chen et al., 2021; Nilashi et al., 2019). Namun, pemeringkatan mungkin mengabaikan data berharga, seperti preferensi pengguna, karena pelanggan mungkin memiliki keluhan tertentu meskipun memberikan peringkat rata-rata yang tinggi (Liu et al., 2019). Di sisi lain, teks ulasan mengungkapkan lebih banyak informasi emosional secara detail dibandingkan dengan rating (Fu et al., 2019). Pelanggan dapat meninggalkan komentar yang mengungkapkan kebahagiaan atau ketidakpuasan mereka. Teks ulasan telah digunakan dalam banyak rekomendasi domain tunggal untuk meningkatkan kinerja (Zheng et al., 2017) dan hanya sedikit yang digunakan dalam rekomendasi lintas domain. (Fu et al., 2019) meningkatkan rekomendasi pengguna dengan memperoleh vektor laten teks ulasan untuk satu domain. Sayangnya, metode mereka tidak dapat memberikan penjelasan semantik untuk prediksi rating. Oleh karena itu, (Wang, Yu, et al., 2020) mengekstraksi aspek dari ulasan untuk memahami hubungan semantik. Aspek adalah konsep semantik tingkat tinggi yang mewakili aspek tertentu dari suatu item dalam domain tertentu (Chin et al., 2018).

Dalam studi ini, kami mengusulkan kerangka kerja baru untuk penilaian dan rekomendasi preferensi yang dipersonalisasi kepada pelanggan, yang disebut rekomendasi personalisasi lintas domain berbasis aspek (AsCDPR). Kami menggunakan peringkat pengguna sebelumnya untuk memprediksi peringkat saat ini dan menggunakan ulasan untuk mengekstrak aspek dan menganalisis polaritasnya. Karena fitur berbasis aspek dapat terdiri dari dua polaritas, Bi-LSTM mengidentifikasi dan mengkodekannya dengan memperhatikan polaritas. Kemudian, jaringan MLP memfilter vektor laten pengguna dan item yang tumpang tindih, menganalisis sentimen, dan memprediksi peringkat untuk rekomendasi preferensi yang dipersonalisasi. Secara eksperimental, selain memprediksi peringkat secara tepat, kerangka kerja kami lebih unggul dalam memberikan rekomendasi hotel yang dipersonalisasi dengan memprioritaskan aspek-aspek polaritasnya yang menjadi perhatian pengguna, terutama di domain yang data ulasannya sedikit. Penelitian kami berupaya mengurangi kesenjangan penelitian yang diabaikan oleh penelitian sebelumnya (Al-Ghossein et al., 2018; Qi et al., 2018; Richa dan Bedi, 2021; Valliyammai dan Ephina Thendral, 2019).

Kami mengusulkan Rekomendasi Personalisasi Lintas-Domain Berbasis Aspek (AsCDPR), sebuah kerangka kerja baru untuk prediksi peringkat dan rekomendasi preferensi pelanggan yang dipersonalisasi. Kami menggabungkan pendekatan yang dipersonalisasi lintas domain dan fitur item berbasis aspek dari teks ulasan. Kami mengekstraksi vektor fitur berbasis aspek dari dua domain menggunakan memori jangka pendek dua arah (Bi-LSTM) dan kemudian memetakannya dengan multilayer perceptron (MLP). Modul rekomendasi lintas domain melatih MLP untuk menganalisis sentimen dan memprediksi peringkat item dan polaritas aspek berdasarkan preferensi pengguna.

Untuk mengevaluasi kerangka kerja yang kami usulkan, kami memilih sumber daya pariwisata sebagai studi kasus kami. Selain itu, jumlah data preferensi terhadap berbagai barang yang ditinggalkan wisatawan tidak konsisten. Karena kami menyarankan pendekatan lintas domain untuk mengatasi masalah cold-start dan ketersebaran data, kumpulan data kami berasal dari restoran sebagai domain sumber dan hotel sebagai domain target. Kami menggunakan dua kumpulan data terbuka dari (Marcheggiani et al., 2014) dan situs web Yelp (https://www.yelp.com/). (Marcheggiani et al., 2014) mengumpulkan 39.934 ulasan pengguna tentang restoran dan 39.587 hotel yang diambil dari situs TripAdvisor (https://www.tripadvisor.com/).

Kedua kumpulan data ini mencakup penilaian dan ulasan pengguna serta penilaian pengguna untuk setiap aspek item. Yelp adalah salah satu situs ulasan paling luas di Amerika Serikat yang menyediakan Yelp Dataset Challenge yang menyimpan informasi toko, data pengguna, dan ulasan produk. Kami memfilter toko menggunakan tag “kategori” item untuk menemukan ulasan “restoran” dan “hotel”. Kami menemukan 5.056.227 ulasan pengguna untuk restoran dan 398.683 ulasan pengguna untuk hotel.

Diperluas dengan sinonimnya, fitur berbasis aspek secara signifikan meningkatkan kinerja analisis sentimen pada akurasi dan matriks skor F1. Dengan nilai MAE dan RMSE yang relatif rendah, AsCDPR mengungguli MF, CMF, EMCDPR, dan PTUPCDR. Nilai tersebut masing-masing adalah 1,3657 dan 1,6682. Studi ini membantu pengguna dalam merekomendasikan hotel berdasarkan preferensi prioritas mereka. Pengguna tidak perlu membaca ulasan orang lain untuk menangkap aspek utama dari suatu item. Model ini dapat meningkatkan keandalan sistem di industri perhotelan dengan memberikan rekomendasi yang dipersonalisasi.

Sistem rekomendasi menjadi penting ketika sebuah situs web dibanjiri dengan ulasan pengguna tentang pengalaman sebelumnya. Selain meningkatkan kepuasan pengguna, rekomendasi hotel mengurangi waktu yang dihabiskan untuk membaca keseluruhan ulasan. Saat ini penelitian mengenai rekomendasi hotel yang dipersonalisasi masih terbatas, terutama pada kondisi lintas domain. Fitur aspek dalam dua domain tidak hanya mentransfer preferensi pengguna dari domain sumber ke domain target tetapi juga mengurangi fitur-fitur tidak penting yang dapat menjadi noise (Sheikhpour et al., 2023). Penelitian kami memperluas polaritas pada aspek dari domain sumber ke domain target untuk menangkap preferensi pengguna pada ulasan sebelumnya. Model kami berhasil memvisualisasikan urutan prioritas berbagai aspek untuk setiap pengguna.

Penelitian ini memberikan banyak implikasi praktis bagi pelaku industri pariwisata. Untuk agen perjalanan/pariwisata yang telah menggunakan kecerdasan buatan (AI) dalam teknologinya, model kami dapat meningkatkan keandalan sistem dengan memberikan rekomendasi hotel yang dipersonalisasi. Pengguna mendapatkan pengalaman pemesanan hotel yang menyenangkan dan bijaksana, sehingga meningkatkan kepuasan pengguna saat menggunakan sistem (Lee et al., 2021) dan menumbuhkan loyalitas pengguna. Dampak tambahan dari penerapan ini adalah pengurangan biaya, terutama untuk kampanye pemasaran. Dengan mengetahui karakteristik pengguna sistem maka target pemasaran menjadi lebih baik dan akurat (De Pelsmacker et al., 2018).

Penerapan sistem rekomendasi berbasis AI di industri perhotelan menghadapi banyak kendala. Semakin besar jumlah data preferensi pengguna yang dikumpulkan, semakin efektif sistem dalam memberikan rekomendasi yang dipersonalisasi. Mengingat volume dan kompleksitas data yang terus meningkat, pengumpulan dan pengelolaan data mungkin menjadi suatu tantangan. Mengumpulkan preferensi pengguna dari berbagai saluran, seperti situs web, media sosial, dan program loyalitas, relatif mudah. Di sisi lain, prosedur pengumpulan data ini erat kaitannya dengan masalah privasi pengguna (Zhou, Liu, et al., 2022). Perusahaan harus menetapkan prosedur yang ketat untuk melindungi kerahasiaan pelanggan. Selain itu, mereka harus transparan dalam seluruh proses pengumpulan dan pemanfaatan data. Penerapan sistem rekomendasi yang dipersonalisasi tidak terlepas dari teknologi yang menyertainya. Investasi dalam sistem rekomendasi yang dipersonalisasi sebanding dengan kecanggihan teknologi yang digunakan (Yuan et al., 2022). Oleh karena itu, kami memilih metode yang relatif mudah dan memberikan hasil yang dapat diandalkan.

Tentu saja, mempertimbangkan fitur berbasis aspek dalam menyematkan model rekomendasi yang dipersonalisasi lintas-domain dapat meningkatkan performa. Namun, masih banyak keterbatasan dalam penelitian ini. Kami masih secara manual mendefinisikan item aspek sebagai parameter yang telah ditentukan sebelumnya. Kami merekomendasikan untuk secara otomatis mengekstrak aspek fitur setiap domain dari ulasan teks untuk pekerjaan di masa depan. Sebagai langkah awal, penandaan polaritas aspek dapat dilakukan secara manual terlebih dahulu, dan model dapat belajar mengevaluasi lebih banyak informasi tentang aspek domain. Menuju sistem rekomendasi yang sepenuhnya otomatis, penandaan polaritas aspek dapat diserahkan kepada model setelah proses pembelajaran model optimal. Sayangnya, tidak ada kebenaran mendasar pada aspek polaritas pada dataset sebelumnya, sehingga menyulitkan peneliti untuk mengukur kinerja polaritas yang dihasilkan. Lebih jauh lagi, jika aspek-aspek tersebut diekstraksi secara otomatis, kemungkinan bahwa aspek-aspek tersebut dapat berubah seiring berjalannya waktu harus dipertimbangkan; deret waktu dapat ditambahkan untuk memberikan informasi preferensi yang lebih terkini kepada pengguna untuk item di domain tertentu.

Penulis: Army Justitia, S.Kom., M.Kom.

Jurnal: AsCDPR: a novel framework for ratings and personalized preference hotel recommendation using cross-domain and aspect-based features