Text Data Pre-processing Tools untuk Analisis Sentimen

Industri 4.0 dan Analisis Sentimen

Salah satu tren yang dibawa oleh era industri 4.0 adalah penerapan kecerdasan buatan pada berbagai macam bidang industri. Pada saat ini-pun kecerdasan buatan senantiasa berkembang mengikuti tuntutan dari masing-masing bidang industri. Salah satu pengaplikasian kecerdasan buatan ini yaitu analisis sentimen. Analisis sentimen adalah cabang kecerdasan buatan yang berfokus pada pengambilan informasi dari teks dengan mengikuti pola pikir yang semirip mungkin dengan manusia misalnya chatbot yang dapat melakukan percakapan secara natural dengan manusia.

Memperkenalkan Tools untuk Analisis Sentimen

Penelitian ini berfokus pada tahap awal dalam pengembangan sebuah sistem analisis sentimen, yaitu tahap pre-processing pada data yang akan digunakan dalam pelatihan model. Tantangan utama dalam membangun sebuah sistem analisis sentimen adalah pelatihan model. Pelatihan model ini sendiri membutuhkan data-data yang sesuai untuk dapat berjalan dengan optimal. Tahap pre-processing inilah yang menjadi salah satu cara untuk membuat data menjadi sesuai untuk digunakan dalam pelatihan model analisis sentimen.

Beberapa hal yang dilakukan pada tahap pre-processing data teks yaitu

  • Membersihkan teks dari gangguan-gangguan atau noise misalnya simbol, tanda baca, tautan, dan lain-lain.
  • Mengubah kata didalam teks menjadi bentuk dasarnya sesuai aturan bahasa yang benar (stemming).
  • Menghilangkan kata-kata yang tidak memiliki makna (stopwords) yang berguna bagi pelatihan model analisis sentimen

Cara Tools Pre-processing Bekerja

Tool bekerja dengan menerima data teks dari pengguna dan menerapkan tiga teknik pre-processing diatas untuk menghasilkan data bersih.

Contoh penerapanya yaitu :

Data Kotor : “RT @atrenal: kita lanjutkan saja diam ini, hingga kau dan aku mengerti. tidak semua kebersamaan, harus melibatkan hati.”

  1. Penerapan pembersihan teks

     2.Penetapan Stemming

3.Penghapusan stopwords

Data Bersih : lanjut saja diam hingga kau erti tidak semua sama harus libat hati

Dampak Pre-processing

Dengan membandingkan akurasi dari model analisis sentimen yang dilatih dengan data mentah dan data yang telah diproses, terlihat peningkatan yang cukup signifikan dari penerapan teknik pre-processing. Sistem analisis sentimen yang dibuat ini adalah sistem yang mengkategorikan sebuah tulisan berdasarkan polaritasnya antara positif, negatif, atau netral.

Masa Depan Chatbot Pembanding Produk

Penerapan teknik pre-processing pada tools ini belum bisa dibilang sempurna, masih ada beberapa teknik pre-processing yang dapat diterapkan kedalam tools ini untuk menghasilkan sistem dengan akurasi yang lebih tinggi lagi, antara lain:

  • Menghilangkan kata sambung negatif dari teks (contoh : tidak senang → sedih)
  • Mengubah dan membedakan kata-kata yang memiliki sifat ambiguitas (contoh : buah → tumbuhan dengan buah → hasil)
  • Mengubah kata-kata yang tidak baku menjadi kata baku (contoh : gw → saya)