PENGARUH STEMMER BAHASA INDONESIA TERHADAP PEFORMA ANALISIS SENTIMEN TERJEMAHAN ULASAN FILM

I Made Artha Agastya

Abstract


Bahasa Indonesia memiliki banyak variasi akhiran, awalan, dan sisipan. Stemming adalah bagian dari prapengolahan dari analisis sentimen yang mendeteksi dan menghilangkan imbuhan tersebut. Pengaruh dari stemming pada analisis sentimen masih belum jelas karena dataset yang digunakan tidak terdistribusi secara bebas. Untuk mendapatkan pengaruh dari stemming terhadap analisis sentimen maka dilakukan percobaan dengan dataset ulasan film yang sudah diterjemahkan ke Bahasa Indonesia. Stemmer Sastrawi sebagai algoritma stemming terbaru digunakan pada penelitian ini. Dataset dibagi menjadi 5 (lima) kategori yang mana 100 data, 250 data, 500 data, 750 data, dan 1000 data. Hasil yang diperoleh menunjukan bahwa stemmer tidak memberikan peningkatan akurasi yang stabil. Bahkan waktu yang diperlukan untuk menyelesaikan analisis sentimen memerlukan waktu meningkat hingga 310 kali lipat. Kenyataan ini sangat buruk karena stemming dapat mengurangi efisiensi dari analisis sentimen.


Full Text:

PDF

References


Aditya, B. R. (2016) ‘A Framework for Sentiment Analysis Implementation of Indonesian Language Tweet on Twitter’, in International Conference on Computing and Applied Informatics 2016, pp. 1–6. doi: 10.1088/1742-6596/755/1/011001.

Adriani, M. et al. (2007) ‘Stemming Indonesian : A Confix-Stripping Approach’, ACM Transactions on Asian Language Information Processing (TALIP), 6(4), pp. 1–33. doi: 10.1145/1316457.1316459.

Agastya, I. M. A., Adji, T. B. and Setiawan, N. A. (2017) ‘Comparison of distributed K-means and distributed fuzzy C-means algorithms for text clustering’, Communication in Science and Technology, 2(1), pp. 11–17. doi: ttp://dx.doi.org/ 10.21924/ cst.2.1.2017.46.

Agusta, L. (2009) ‘Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia’, in Konferensi Nasional Sistem dan Informatika 2009, pp. 196–201.

Aliandu, P. (2013) ‘Twitter Used by Indonesian President : An Sentiment Analysis of Timeline’, (December), pp. 2–4.

Arifin, A. Z., Mahendra, I. P. A. K. and Ciptaningtyas, H. T. (2009) ‘Enhanced Confix Stripping Stemmer and Ants Algorithm For Classifying News Document In Indonesian Language’, in Proceeding of International Conference on Information & Communication Technology and Systems (ICTS), pp. 149–158.

Buntoro, G. A. (2017) ‘Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter’, 32 Integer Journal Maret, 1(2016), pp. 32–41.

Chifu, E. Ş., Letia, T. Ş. and Chifu, V. R. (2015) ‘Unsupervised aspect level sentiment analysis using Ant Clustering and Self-organizing Maps’, 2015 International Conference on Speech Technology and Human-Computer Dialogue, SpeD 2015. doi: 10.1109/SPED.2015.7343075.

Faradhillah, N. Y. A., Kusumawardani, R. P. and Hafidz, I. (2016) ‘Eksperimen Sistem Klasifikasi Analisa Sentimen Twitter pada Akun Resmi Pemerintah Kota Surabaya Berbasis Pembelajaran Mesin’, Prosiding Seminar Nasional Sistem Informasi Indonesia 2016, pp. 15–24.

Franky and Manurung, R. (2008) ‘Machine Learning-based Sentiment Analysis of Automatic Indonesian Translations of English Movie Reviews’, International Conference on Advanced Computational Intelligence and Its Application (ICACIA), 1.

Haykin, S. (2009) Neural Networks and Learning Machines. 3rd edn, Prentice Hall. 3rd edn. New Jersey: Pearson Prentice Hall.

Hidayatullah, A. F., Ratnasari, C. I. and Wisnugroho, S. (2016) ‘The Influence of Stemming on Indonesian Tweet Sentiment Analysis’, TELKOMNIKA (Telecommunication Computing Electronics and Control), 14(June), pp. 665–673. doi: 10.12928/TELKOMNIKA.v14i1.3113.

Kaur, H., Mangat, V. and Nidhi (2017) ‘A Survey of Sentiment Analysis techniques’, in International conference on I-SMAC (IoT in Social, Mobile, Analytics and Cloud) (I-SMAC 2017), pp. 921–925. doi: 10.5715/jnlp.13.3_201.

Librian, A. (2017) High quality stemmer library for Indonesian Language (Bahasa), GitHub. Available at: https://github.com/sastrawi (Accessed: 20 February 2018).

Liu, B. (2012) ‘Sentiment Analysis and Opinion Mining’, Synthesis Lectures on Human Language Technologies, 5(1), pp. 1–167. doi: 10.2200/S00416ED1V01Y201204HLT016.

Liu, B. and Zhang, L. (2012) ‘A survey of opinion mining and sentiment analysis’, Mining Text Data, 9781461432, pp. 415–463. doi: 10.1007/978-1-4614-3223-4_13.

Maas, A. L. et al. (2011) ‘Learning Word Vectors for Sentiment Analysis’, Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, pp. 142–150. doi: 978-1-932432-87-9.

Suresh, H. and S., G. R. (2016) ‘An unsupervised fuzzy clustering method for twitter sentiment analysis’, 2016 International Conference on Computation System and Information Technology for Sustainable Solutions (CSITSS), pp. 80–85. doi: 10.1109/CSITSS .2016.7779444.

Surjandari, I., Naffisah, M. S. and Prawiradinata, M. I. (2015) ‘Text Mining of Twitter Data for Public Sentiment Analysis of Staple Foods Price Changes’, Journal of Industrial and Intelligent Information, 3(3), pp. 253–257. doi: 10.12720/jiii.3.3.253-257.

Tahitoe, A. D. and Purwitasari, D. (2010) Implementasi Modifikasi Enhanced Confix Stripping Stemmer Untuk Bahasa Indonesia dengan Metode Corpus Based Stemming. Institut Teknologi Sepuluh November (ITS).

Tala, F. Z. (2003) A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia.

UN Global Pulse (2014) ‘Mining Indonesian Tweets to Understand Food Price Crises’, (February), pp. 1–18.

Wira, P. and Indra, D. (2010) ‘Pengklasifikasian Otomatis Berbasis Ontologi untuk Artikel Berita Berbahasa Indonesia’, MAKARA, TEKNOLOGI, 14(1), pp. 29–35.




DOI: https://doi.org/10.33365/jtk.v12i1.70

Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 I Made Artha Agastya

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


Jurnal Tekno Kompak
Published by Universitas Teknokrat Indonesia
Organized by Program Studi D3 Sistem Informasi AkuntansiUniversitas Teknokrat Indonesia
Jl. Zainal Abidin Pagaralam, No.9-11, Labuhanratu, Bandarlampung, Indonesia
Telepon : 0721 70 20 22
W : http://ejurnal.teknokrat.ac.id/index.php/teknokompak
E  : teknokompak@teknokrat.ac.id.

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


Jumlah Pengunjung : View Tekno Kompak StatsCounter

Flag Counter