ANALISIS PERFORMANSI ENTITY MATCHING DENGAN FUZZY WUZZY PADA ARTIKEL FAIRNESS AI

Indira Salsabila Ardan, Miftakhul Janah Sulastri, Nur Aini Rakhmawati

Abstract


Dalam era digital saat ini, mencari informasi mengenai topik tertentu semakin mudah dilakukan melalui mesin pencari seperti Google Scholar atau database artikel ilmiah. Google Scholar memungkinkan pengguna untuk menemukan artikel atau jurnal ilmiah dari berbagai bidang ilmu serta berfungsi sebagai perpustakaan pribadi yang memungkinkan pengguna untuk menyimpan jurnal-jurnal terpilih. Namun, karena jumlah artikel ilmiah yang begitu banyak, sering kali sulit untuk menentukan artikel mana yang paling relevan dengan topik tertentu dan memiliki tingkat keakuratan yang tinggi. Salah satu teknik yang digunakan untuk memilih artikel ilmiah yang relevan dengan topik tertentu adalah dengan menggunakan entitymatching.Penelitian ini bertujuan untuk melakukan analisis performansi dari teknik entitymatching menggunakan FuzzyWuzzy dengan penambahan blocking stop wordremoval dan sizeblocking pada artikel bertema Fairness in AI. Teknikentitymatching dilakukan dengan membandingkan title dengan title, authors dengan authors, dan keywords dengan keywords. Pembobotanditerapkan pada title, authors, dan keywordsserta terdapat empat variasi pembobotan yang digunakan. Blocking juga diterapkan untuk meningkatkan kecepatan dan efisiensi teknikentitymatching.Hasil analisis menunjukkan bahwa bobot yang digunakan dalam teknikentitymatching memiliki peran penting dalam mencapai performa yang optimal. Bobot 0.5 untuk title, 0.1 untuk authors, dan 0.4 untuk keywords menghasilkan performa terbaik dengan accuracy sebesar 71.26%, recall sebesar 48.34%, precision sebesar 92.74%, dan f-1 score sebesar 63.56%. Selain itu, penerapan sizeblocking dapat mempercepat proses perbandingan data secara signifikan, dengan runningtime sebesar 2.56 detik tanpa mengorbankan performa. 

Full Text:

PDF

References


A. Setiani Rafika, H. Yunan Putri, F. Diah Widiarti, D. STMIK Raharja Tangerang, M. STMIK Raharja Tangerang, and J. Jendral Sudirman No, “ANALISIS MESIN PENCARIAN GOOGLE SCHOLAR SEBAGAI SUMBER BARU UNTUK KUTIPAN,” vol. 3, no. 2, 2017.

“GOOGLE SEBAGAI SUMBER INFORMASI UNTUK MENULIS DI ERA DISRUPSI COVID-19 | Dinas Perpustakaan dan Kearsipan Provinsi Banten.” https://dpk.bantenprov.go.id/Layanan/topic/265 (accessed Apr. 02, 2023).

W. Khairiyah, “Nautical : Jurnal Ilmiah Multidisiplin Pemanfaatan google scholar dalam pemenuhan kebutuhan informasi penelitian mahasiswa prodi perpustakaan dan ilmu informasi Universitas Negeri Padang,” J. Ilm. Multidisiplin Indones., vol. 1, no. 9, pp. 1058–1071, 2022.

N. Barlaug and J. A. Gulla, “Neural Networks for Entity Matching: A Survey,” ACM Trans. Knowl. Discov. Data, vol. 15, no. 3, 2021, doi: 10.1145/3442200.

“KARYA TULIS ILMIAH DALAM PENGEMBANGAN SUMBERDAYA MANUSIA DI ORGANISASI PEMERINTAH.” https://ppsdmaparatur.esdm.go.id/artikel/karya-tulis-ilmiah-dalam-pengembangan-sumberdaya-manusia-di-organisasi-pemerintah (accessed Apr. 02, 2023).

“FuzzyWuzzy Python library - GeeksforGeeks.” https://www.geeksforgeeks.org/fuzzywuzzy-python-library/ (accessed Apr. 02, 2023).

B. Alhadidi and M. Wedyan, “Hybrid Stop-Word Removal Technique for Arabic Language.,” Egypt. Comput. Sci. J., vol. 30, pp. 35–38, Jan. 2008.

A. Jelita, “Effective Techniques for Indonesian Text Retrieval,” Ph.D Thesis, pp. 1–286, 2007, [Online]. Available: https://researchbank.rmit.edu.au/view/rmit:6312

K. Rinartha, “Simple Query Suggestion Untuk Pencarian Artikel Menggunakan Jaccard Similarity,” J. Ilm. Rekayasa dan Manaj. Sist. Inf., vol. 3, no. 1, pp. 30–34, 2017.

A. Agustiawan, “Analisis Similarity/Kemiripan Artikel Jurnal Online Terbitan Tahun 2019-2020 Di ISI Yogyakarta,” ABDI PUSTAKA J. Perpust. dan Kearsipan, vol. 2, no. 1, pp. 29–43, 2022, doi: 10.24821/jap.v2i1.6984.

W. Lubis, Y. A. Sari, and M. A. Fauzi, “Klasifikasi Multilabel Menggunakan Metode Fuzzy Similarity K-Nearest Neighbor Untuk Rekomendasi Pencarian Artikel Online,” vol. 3, no. 1, pp. 931–939, 2019, [Online]. Available: http://j-ptiik.ub.ac.id

G. U. Abriani and M. A. Yaqin, “Implementasi Metode Semantic Similarity untuk Pengukuran Kemiripan Makna antar Kalimat,” Ilk. J. Comput. Sci. Appl. Informatics, vol. 1, no. 2, pp. 47–57, 2019, doi: 10.28926/ilkomnika.v1i2.15.

N. F. Azkia, “Meta-Analisis Pengaruh Media Pembelajaran Berbasis Digital terhadap Hasil Belajar Matematika,” Feb. 2023, Accessed: Apr. 03, 2023. [Online]. Available: https://repository.uinjkt.ac.id/dspace/handle/123456789/67090

A. D. I. RAHAYU, “Implementasi Fuzzy Mcdm Topsis Pada Functional Design Untuk Mendukung Proses Pengembangan Produk Ventela Public Low,” Sep. 2021, Accessed: Apr. 03, 2023. [Online]. Available: https://dspace.uii.ac.id/handle/123456789/36264




DOI: https://doi.org/10.33365/jti.v17i2.2711

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Indira Salsabila Ardan, Miftakhul Janah Sulastri, Nur Aini Rakhmawati

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


JURNAL TEKNOINFO
Published by Universitas Teknokrat Indonesia
Organized by Prodi S1 Informatika FTIK Universitas Teknokrat Indonesia

W: http://ejurnal.teknokrat.ac.id/index.php/teknoinfo/index
E : teknoinfo@teknokrat.ac.id.
Jl. Zainal Abidin Pagaralam, No.9-11, Labuhan Ratu, Bandarlampung

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jumlah Pengunjung : View Teknoinfo StatsCounter

Flag Counter