Penerapan Normalisasi Kata Tidak Baku Menggunakan Levenshtein Distance pada Analisa Sentimen Layanan PT. KAI di Twitter

2019: Seminar Informatika Aplikatif 2019

Imam Fahrur Rozi
Rizky Ardiansyah
Naomi Rebeka

Abstract

Pertumbuhan media sosial saat ini, menjadi salah satu jalan bagi masyarakat untuk memberikan opini balik berupa feedback kepada pelayanan transportasi publik, seperti pada layanan Kereta Api Indonesia (KAI). Masyarakat akan memberikan opini atau feedback terhadap layanan dan infrastruktur yang diberikan. Namun, seiring bertambahnya tweet yang semakin banyak, pengelola Twitter PT. KAI dan masyarakat lainnya merasa kesulitan untuk membaca tweet feedback dan opini yang tidak memiliki arti atau kesalahan ejaan, juga kesulitan dalam menggolongkan tweet kedalam kategori-kategori tertentu, seperti positif, netral dan negatif. Padahal informasi tweet yang memiliki arti dan pengkategorian dari feedback masyarakat ini sangat diperlukan untuk evaluasi dan menentukan kebijakan KAI.


Sehingga dibutuhkan suatu sistem yang dapat membantu memperbaiki kata-kata yang tidak memiliki arti serta mengklasifikasikan tweet ke dalam kategori positif, negatif dan netral secara otomatis. Sistem serupa sebelumnya telah dibuat menggunakan metode Naïve Bayes dengan nilai akurasi sebesar 75% tanpa seleksi fitur Chi Square dan 80% dengan seleksi fitur Chi Square. Pengembangan kali ini akan menggunakan Naïve Bayes, namun dengan normalisasi kata menggunakan Levenshtein Distance.


Penelitian menggunakan data training sebanyak 450 data dengan masing-masing kategori sebanyak 150 positif, 150 negatif dan 150 netral. Hasil pengujian pada 100 data uji dari penelitian sebelumnya menghasilkan tingkat akurasi sebesar 67.05% menggunakan Levenshtein Distance dan 63.83% tanpa Levenhstein Distance pada proses klasifikasi menggunakan Naïve Bayes.