PENGARUH PENAMBAHAN KORPUS PARALEL PADA MESIN PENERJEMAH STATISTIK BAHASA INDONESIA KE BAHASA LAMPUNG DIALEK NYO

Zaenal Abidin, Permata permata

Abstract


Provinsi Lampung merupakan salah satu provinsi yang terletak di pulau Sumatera.  Masyarakat provinsi Lampung menggunakan dua bahasa daerah yaitu bahasa Lampung dialek Api dan bahasa Lampung dialek Nyo. Untuk para pendatang di provinsi Lampung memiliki permasalahan dalam komunikasi dengan penduduk asli Lampung. Sebagai alternatinya, baik pendatang dan penduduk asli Lampung berkomunikasi dengan bahasa Indonesia. Potensi penelitian penerjemahan bahasa Indonesia ke Lampung terbuka lebar. Penelitian ini difokuskan untuk membangun model penerjemahan bahasa Indonesia ke dalam dialek bahasa Lampung Nyo dengan pendekatan Mesin Statistik Terjemahan dan alat yang digunakan untuk itu adalah Moses. Penelitian diawali dengan (1) membuat korpus paralel bahasa Indonesia dan terjemahannya dalam dialek bahasa Lampung bahasa Nyo, kemudian membuat mono korpus bahasa Lampung dialek Nyo, (2) membangun model bahasa, (3) membangun terjemahan model, (4) memadukan model bahasa dan model terjemahan menggunakan Decoder Moses untuk dapat menerjemahkan dari bahasa dialek bahasa Indonesia ke bahasa Lampung Nyo. Eksperimen penelitian difokuskan untuk mengamati pengaruh penambahan korpus paralel dari 1000 kalimat, 2000 kalimat dan 3000 kalimat. Penelitian ini menggunakan 100 kalimat tes yang tidak berada dalam korpus paralel atau korpus mono. Hasil penelitian menunjukkan bahwa nilai akurasi saat menggunakan 1000 kalimat, 2000 kalimat dan 3000 kalimat merupakan nilai akurasi evaluasi bilingual yang diteliti berturut-turut yaitu 25.91%, 43.18% dan 45.26%.     


Full Text:

PDF

References


F. Ariyani, “Distribusi Verba Berfrefiks (N-) Pada Bahasa Lampung dalam Kitab Kuntara Raja Niti dan Buku Ajar. Ranah: Jurnal Kajian Bahasa 3,” Ranah J. Kaji. Bhs., vol. 3, no. 2, pp. 124–134, 2014, doi: https://doi.org/10.26499/rnh.v3i2.43.

Z. Abidin, “Penerapan Neural Machine Translation untuk Eksperimen Penerjemahan secara Otomatis pada Bahasa Lampung – Indonesia,” Pros. Semin. Nas. Metod. Kuantitatif 2017, no. 978, pp. 53–68, 2017.

Z. Abidin, A. Sucipto, and A. Budiman, “Penerjemahan Kalimat Bahasa Lampung-Indonesia Dengan Pendekatan Neural Machine Translation Berbasis Attention Translation of Sentence Lampung-Indonesian Languages With Neural Machine Translation Attention Based,” J. Kelitbangan, vol. 06, no. 02, pp. 191–206, 2018.

P. Permata and Z. Abidin, “Statistical Machine Translation Pada Bahasa Lampung Dialek Api Ke Bahasa Indonesia,” Media Inform. Budidarma, vol. 4, no. 3, pp. 519–528, 2020, doi: 10.30865/mib.v4i3.2116.

S. Ningsih and S. Saniati, “Eksperimen Pengenalan Ucapan Aksara Lampung Dengan CMU Sphinx 4,” J. Teknoinfo, vol. 12, no. 1, p. 33, 2018, doi: 10.33365/jti.v12i1.40.

T. Apriani, H. Sujaini, and N. Safriadi, “Pengaruh Kuantitas Korpus Terhadap Akurasi Mesin Penerjemah Statistik Bahasa Bugis Wajo Ke Bahasa Indonesia,” J. Sist. dan Teknol. Inf., vol. 1, no. 1, pp. 1–6, 2016.

R. Darwis, H. Sujaini, and R. D. Nyoto, “Peningkatan Mesin Penerjemah Statistik dengan Menambah Kuantitas Korpus Monolingual (Studi Kasus : Bahasa Indonesia - Sunda),” J. Sist. dan Teknol. Inf., vol. 7, no. 1, p. 27, 2019, doi: 10.26418/justin.v7i1.27254.

H. S. Simon and A. Purwarianti, “Experiments on Indonesian-Japanese statistical machine translation,” Proceeding - IEEE Cybern. 2013 IEEE Int. Conf. Comput. Intell. Cybern., pp. 80–84, 2013, doi: 10.1109/CyberneticsCom.2013.6865786.

M. A. Sulaeman and A. Purwarianti, “Development of Indonesian-Japanese statistical machine translation using lemma translation and additional post-process,” Proc. - 5th Int. Conf. Electr. Eng. Informatics Bridg. Knowl. between Acad. Ind. Community, ICEEI 2015, no. i, pp. 54–58, 2015, doi: 10.1109/ICEEI.2015.7352469.

A. H. Imam, M. R. Mahmud Arman, S. H. Chowdhury, and K. Mahmood, “Impact of corpus size and quality on English-Bangla statistical machine translation system,” 14th Int. Conf. Comput. Inf. Technol. ICCIT 2011, no. Iccit, pp. 566–571, 2011, doi: 10.1109/ICCITechn.2011.6164853.

R. Nugroho Aditya, T. Adji Bharata, and B. Hantono S, “Penerjemahan Bahasa Indonesia dan Bahasa Jawa Menggunakan Metode Statistik Berbasis Frasa,” Semin. Nas. Teknol. Inf. dan Komun., vol. 2015, no. Sentika, 2015.

H. Tanuwijaya and H. Manurung, Maruli, “Penerjemah Dokumen Inggris-Indonesia Menggunakan Mesin Penerjemah Statistik Dengan Word Reordering dan Phrase Reordering,” J. Ilmu Komput. dan Inf., vol. 2, no. 1, pp. 17–24, 2009.

A. Hermanto, T. Adji, and N. A. Setiawan, “Recurrent neural network language model for English-Indonesian Machine Translation: Experimental study.,” in ICSITech, 2015, pp. 132–136.

K. Papineni, S. Roukos, T. Ward, and W.-J. Zhu, “BLEU: a Method for Automatic Evaluation of Machine Translation,” Proc. 40th Annu. Meet. Assoc. Comput. Linguist., pp. 311–318, 2002, doi: 10.1002/andp.19223712302.

P. Koehn, Statistical Machine Translation SystemUser Manual and Code Guide. 2019.




DOI: https://doi.org/10.33365/jti.v15i1.889

Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Permata permata, Zaenal Abidin

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


JURNAL TEKNOINFO
Published by Universitas Teknokrat Indonesia
Organized by Prodi S1 Informatika FTIK Universitas Teknokrat Indonesia

W: http://ejurnal.teknokrat.ac.id/index.php/teknoinfo/index
E : teknoinfo@teknokrat.ac.id.
Jl. Zainal Abidin Pagaralam, No.9-11, Labuhan Ratu, Bandarlampung

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jumlah Pengunjung : View Teknoinfo StatsCounter

Flag Counter