• UGM
  • IT Center
Universitas Gadjah Mada Cloud Experience Research Group
Department of Electrical Engineering & Information Technology
Faculty of Engineering Universitas Gadjah Mada
  • Home
  • Roadmap
  • Researches Area
    • Modern Enterprise and Software Engineering Methodology (MESEM)
    • Technology Enhanced Learning and Optimization (TELO)
    • Cloud Adoption and Cognitive Application (CACA)
  • Articles
  • Videos
  • Researcher
  • Home
  • Articles

Text Data Pre-processing Tools untuk Analisis Sentimen

  • Articles
  • 8 July 2019, 13.54
  • By :

Industri 4.0 dan Analisis Sentimen

Salah satu tren yang dibawa oleh era industri 4.0 adalah penerapan kecerdasan buatan pada berbagai macam bidang industri. Pada saat ini-pun kecerdasan buatan senantiasa berkembang mengikuti tuntutan dari masing-masing bidang industri. Salah satu pengaplikasian kecerdasan buatan ini yaitu analisis sentimen. Analisis sentimen adalah cabang kecerdasan buatan yang berfokus pada pengambilan informasi dari teks dengan mengikuti pola pikir yang semirip mungkin dengan manusia misalnya chatbot yang dapat melakukan percakapan secara natural dengan manusia.

Memperkenalkan Tools untuk Analisis Sentimen

Penelitian ini berfokus pada tahap awal dalam pengembangan sebuah sistem analisis sentimen, yaitu tahap pre-processing pada data yang akan digunakan dalam pelatihan model. Tantangan utama dalam membangun sebuah sistem analisis sentimen adalah pelatihan model. Pelatihan model ini sendiri membutuhkan data-data yang sesuai untuk dapat berjalan dengan optimal. Tahap pre-processing inilah yang menjadi salah satu cara untuk membuat data menjadi sesuai untuk digunakan dalam pelatihan model analisis sentimen.

Beberapa hal yang dilakukan pada tahap pre-processing data teks yaitu

  • Membersihkan teks dari gangguan-gangguan atau noise misalnya simbol, tanda baca, tautan, dan lain-lain.
  • Mengubah kata didalam teks menjadi bentuk dasarnya sesuai aturan bahasa yang benar (stemming).
  • Menghilangkan kata-kata yang tidak memiliki makna (stopwords) yang berguna bagi pelatihan model analisis sentimen

Cara Tools Pre-processing Bekerja

Tool bekerja dengan menerima data teks dari pengguna dan menerapkan tiga teknik pre-processing diatas untuk menghasilkan data bersih.

Contoh penerapanya yaitu :

Data Kotor : “RT @atrenal: kita lanjutkan saja diam ini, hingga kau dan aku mengerti. tidak semua kebersamaan, harus melibatkan hati.”

  1. Penerapan pembersihan teks

     2.Penetapan Stemming

3.Penghapusan stopwords

Data Bersih : lanjut saja diam hingga kau erti tidak semua sama harus libat hati

Dampak Pre-processing

Dengan membandingkan akurasi dari model analisis sentimen yang dilatih dengan data mentah dan data yang telah diproses, terlihat peningkatan yang cukup signifikan dari penerapan teknik pre-processing. Sistem analisis sentimen yang dibuat ini adalah sistem yang mengkategorikan sebuah tulisan berdasarkan polaritasnya antara positif, negatif, atau netral.

Masa Depan Chatbot Pembanding Produk

Penerapan teknik pre-processing pada tools ini belum bisa dibilang sempurna, masih ada beberapa teknik pre-processing yang dapat diterapkan kedalam tools ini untuk menghasilkan sistem dengan akurasi yang lebih tinggi lagi, antara lain:

  • Menghilangkan kata sambung negatif dari teks (contoh : tidak senang → sedih)
  • Mengubah dan membedakan kata-kata yang memiliki sifat ambiguitas (contoh : buah → tumbuhan dengan buah → hasil)
  • Mengubah kata-kata yang tidak baku menjadi kata baku (contoh : gw → saya)
Tags: caca capstone Chatbot ECHA

Related Posts

Topik Penelitian 2023 di Cloud Experience Research Group

ArticlesVideos Wednesday, 30 November 2022

Penelitian memang sesuatu yang menarik untuk dilakukan, terlebih lagi jika kita berminat untuk mendalami suatu topik. Tahun 2023 adalah tahun penuh tantangan dan peluang. Di satu sisi dunia tengah mengalami kondisi ekonomi yang berbeda pasca COVID-19 yang bisa jadi akan terjadi lagi di dunia mana pun.

Pengembangan Aplikasi Requirement Change Management dengan Proses Bisnis dan Tata Kelola Berbasis Web dengan PERN Stack

Articles Thursday, 22 September 2022

Dalam suatu proses pengembangan perangkat lunak, seorang product owner memiliki peran utama untuk mencapai suatu keberhasilan dalam timnya dengan mendefinisikan requirement, mengatur prioritas pengembangan, kualitas hingga keberhasilan pengembangannya.

Perancangan Pengalaman Pengguna, Arsitektur dan Implementasi Frontend-Backend Sistem Manager Berbasis SCORM untuk Mendukung Penyusunan Konten E-Learning

Articles Friday, 2 September 2022

Ketika pandemi Covid-19 berada di skala tertinggi, mendorong kebutuhan penggunaan e-learning menjadi meningkat dari sebelumnya bahkan menjadi hal yang semakin signifikan untuk dilakukan.

Model Penilaian Triangulasi untuk Proyek Capstone dalam Rekayasa Perangkat Lunak

Articles Sunday, 8 November 2020

Mengupas Tuntas Pengukuran Penilaian

Proyek capstone didefinisikan sebagai kegiatan kumulatif untuk menutup pengalaman dunia nyata kepada mahasiswa. Proyek capstone diperlukan untuk menunjukkan peluang di industri yang tidak tersedia dalam kurikulum.

Universitas Gadjah Mada

CLOUD EXPERIENCE RESEARCH GROUP

Department of Electrical Engineering & Information Technology

Faculty of Engineering 

Universitas Gadjah Mada

 

Jl. Grafika No.2 Sinduadi, Mlati, Sleman

Daerah Istimewa Yogyakarta 55281, Indonesia

+ 62 123 456 789

cloudex@yeah.com

© Universitas Gadjah Mada