Aplikasi Penyusun Tesaurus Kata Tidak Baku

2020: Seminar Informatika Aplikatif Polinema (SIAP) - 2020

Pramana Yoga Saputra
Ika Kusumaning Putri
Ryan Revantara Yuda

Abstract

Penggunaan mesin pencarian untuk saat ini sangat sering dipergunakan. Tetapi banyak pengguna masih salah untuk memasukan query sehingga hasil yang ditampilkan mesin pencarian tidak sesuai harapan. Banyak pengguna awam yang memasukan query dengan kata tidak baku. Penelitian ini mencoba untuk membantu pengguna awam sehingga hasil pencarian sesuai dengan harapan mereka. Data diambil dari tweet twitter, komentar youtube dan novel yang diasumsikan banyak mengandung kata tidak baku. Pada pengolahan dokumen terdapat beberapa langkah yaitu scraping data, preprocessing, filtering, pembentukan informasi cooccurrence. Metode Coocurrence untuk pembentukan tesaurus yang digunakan untuk sistem temu kembali informasi menggunakan query expansion dapat menghasilkan nilai f-measure yang lebih baik dari sistem temu kembali informasi yang tidak menggunakan query expansion dengan menghasilkan recall 81,9% , precision 39,2%, dan f-measure 41,6%.