IDENTIFIKASI OTOMATIS PESAN SAKSI MATA PADA MEDIA SOSIAL SAAT BENCANA GEMPA

Sarah Monika Nooralifa, Mohammad Reza Faisal, Friska Abadi, Radityo Adi Nugroho, Muliadi Aziz

Abstract


Social media platforms such as Twitter make it easy for users to share and receive critical information on disasters and emergencies. Information from eyewitnesses can be useful for law enforcement agencies and humanitarian organizations. Identification disaster messages on Twitter can also be used as information that can be used to see the current situation. In several research studies, earthquake disasters are divided into three categories: eyewitnesses, non-eye witnesses, and do not know. Meanwhile, the feature extraction that used in this research is bag-of-words that produce high-dimensional data output. The purpose of this research is to utilize lexicon-based feature extraction to produce low-dimensional data. However, there has never been the use of Lexicon based on the multiclass classification in cases of natural disasters. The features built by the Lexicon-based are far less, namely 2-15 features. This research was divided into two steps, namely the first step was carried out without combining Lexicon and the second step was carried out by combining Lexicon. The highest accuracy produced by the combination of Barasa SentiwordNet, Bing Liu, NRC, AFINN, and Heeryon Cho’s Lexicon using the Support Vector Machine classification with an accuracy of 64.13% with a total of 15 features.

Keywords: Lexicon Based, Support Vector Machine, Classification, Text Mining, Twitter, Disasters

Platform media sosial seperti Twitter memudahkan para pengguna untuk berbagi dan menerima informasi penting selama bencana dan keadaan darurat. Informasi dari saksi mata dapat berguna bagi lembaga penegak hukum dan organisasi kemanusiaan. Pesan bencana di Twitter juga dapat digunakan sebagai informasi yang digunakan untuk mengetahui situasi yang sedang berlangsung. Pada beberapa riset yang telah dilakukan oleh peneliti, tweet bencana gempa dibagi menjadi tiga kategori yaitu eyewitness, non-eyewitness, dan don’t know. Sedangkan ekstraksi fitur yang digunakan pada riset-riset tersebut adalah bag-of-words yang menghasilkan keluaran berupa data berdimensi tinggi. Tujuan penelitian ini adalah memanfaatkan ekstraksi fitur berbasis lexicon untuk menghasilkan data berdimensi rendah. Namun belum pernah ada pemanfaatan Lexicon Based untuk klasifikasi multiclass pada kasus klasifikasi pesan bencana alam. Fitur yang dihasilkan oleh Lexicon based jauh lebih sedikit yaitu 2-15 fitur. Penelitian ini dibagi menjadi dua tahap, yaitu tahap pertama dilakukan tanpa penggabungan kamus Lexicon dan tahap kedua dilakukan dengan menggabungkan kamus Lexicon. Akurasi tertinggi dihasilkan oleh kombinasi Barasa SentiwordNet, Bing Liu, NRC, AFINN, dan Lexicon Heeryon Cho menggunakan klasifikasi Support Vector Machine dengan akurasi sebesar 64,13% dengan jumlah fitur sebanyak 15 fitur.

 

Kata kunci: Lexicon based, Support Vector Machine, Klasifikasi, Text Mining, Twitter, Bencana Alam


Full Text:

PDF

References


Cho, H., Lee, J.-S., & Kim, S. (2013). Enhancing Lexicon-Based Review Classification by Merging and Revising Sentiment Dictionaries. Proceedings of the Sixth International Joint Conference on Natural Language Processing, October, 463–470. http://www.aclweb.org/anthology/I13-1053

Gaikwad, G., & Joshi, D. J. (2016). Multiclass Mood classification on twitter using lexicon dictionary and machine learning algorithms. Proceedings of the International Conference on Inventive Computation Technologies, ICICT 2016, 1, 1–6. https://doi.org/10.1109/INVENTIVE.2016.7823247

Kurniawan, A., Indriati, & Adinugroho, S. (2019). Analisis Sentimen Opini Film Menggunakan Metode Naïve Bayes dan Lexicon Based Features. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 3(9), 8335–8342.

Mahendrajaya, R., Buntoro, G. A., & Setyawan, M. B. (2019). Analisis Sentimen Pengguna Gopay Menggunakan Metode Lexicon Based Dan Support Vector Machine. Komputek, 3(2), 52. https://doi.org/10.24269/jkt.v3i2.270

Rohman, A. N., Utami, E., & Raharjo, S. (2019). Deteksi Kondisi Emosi pada Media Sosial Menggunakan Pendekatan Leksikon dan Natural Language Processing. Eksplora Informatika, 9(1), 70–76. https://doi.org/10.30864/eksplora.v9i1.277

Zahra, K., Imran, M., & Ostermann, F. O. (2020). Automatic identification of eyewitness messages on twitter during disasters. Information Processing and Management, 57(1), 102107. https://doi.org/10.1016/j.ipm.2019.102107




DOI: http://dx.doi.org/10.20527/klik.v8i2.351

Copyright (c) 2021 KLIK - KUMPULAN JURNAL ILMU KOMPUTER

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Indexed by:

  
 

 

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.joomla
counter View My Stats