ANALISA ALGORITMA STEMMER DAN STOPWORD LIST PADA UNJUK KERJA SISTEM ANALISA SENTIMEN

  • Imam Fahrur Rozi Program Studi Teknik Informatika, Jurusan Teknologi Informasi, Politeknik Negeri Malang
  • Yushintia Pramitarini Program Studi Teknik Informatika, Jurusan Teknologi Informasi, Politeknik Negeri Malang
  • Prasetyo Bagus Pramono Program Studi Teknik Informatika, Jurusan Teknologi Informasi, Politeknik Negeri Malang

Abstract

Algoritma stemming dan stopword biasa digunakan dalam dokumen atau teks bahasa Indonesia yang baku dan memiliki morfologi bahasa yang baik dan benar. Pada penelitian kali ini, penulis melakukan uji coba meletakkan algoritma stemming dan stopword pada proses preprocessing sistem analisa sentimen pada data komentar review handphone di youtube dengan menggunakan dua algoritma stemming dan dua algoritma stopword. Data yang di proses adalah dataset komentar, sebagian data komentar memiliki morfologi bahasa yang tidak baku, sehingga pada penelitian ini mencoba apa pengaruh dari algoritma stemming dan stopword pada proses preprocessing yang nantinya akan di analisa terhadap akurasi pada pengklasifikasian dengan metode pengujian penelitian sebelumnya.

Stemming merupakan proses pemotongan (pembuangan) imbuhan (affix), baik prefix maupun suffix, dari sebuah term untuk mendapatkan kata dasar (root atau stem) dari kata berimbuhan. Stopword merupakan kata-kata yang diabaikan dalam pemrosesan data di NLP (Natural Language Processing), bertujuan untuk menghapus frekuensi kemunculan kata yang dianggap tidak penting atau tidak menggambarkan isi dokumen sehingga proses pengklasifikasian lebih efektif dan akurat. Pada data komentar akan di proses perubahan katanya dan akan diambil kata dasarnya setelah kata dasar di peroleh, kata tersebut akan di cocokkan kembali pada kamus yang dimiliki dari setiap algoritma. Pencocokkan kata dasar akan diĀ  kalkulasi lalu dihitung tingkat akurasi setelah itu akan dianalisa apakah algoritma stemming dan stopword list dapat digunakan pada analisa sentimen.

Published
2018-08-31