KOMBINASI METODE K-MEANS DAN DECISION TREE DENGAN PERBANDINGAN KRITERIA DAN SPLIT DATA
Abstract
Data mining merupakan suatu proses mencari pola atau menarik informasi data besar dan terpilih menggunakan teknik atau metode tertentu. Metode K-Means dan Decision Tree merupakan bagian dari teknik Data Mining. Penelitian ini akan mengkombinasikan metode K-Means untuk melakukan clustering data menjadi 3 cluster kemudian hasil dari clustering akan di klasifikasi menggunakan Metode Decision Tree dengan perbandingan kriteria Gain Ratio, Information Gain dan Gini Index. Data yang diolah di bagi (split) menjadi 2 yaitu data training dan data testing dengan prosentase 70:30, 80:20 dan 90:10. Hasil dari penelitian untuk menemukan kriteria mana yang menghasilkan pohon keputusan dan performa terbaik berdasarkan nilai akurasi tertinggi dari masing-masing kelompok data. Data diambil dari Repository UCI dengan jumlah 811 record dan 52 atribut. Dari pengolahan data yang dilakukan diketahui Untuk split data 70:30, nilai akurasi dengan kriteria Gain Ratio, Information Gain dan Gini Index mendapatkan nilai sama yaitu 97,53. Kriteria Gain Ratio dan Gini Index menghasilkan nilai akurasi tertinggi yaitu 98,15% untuk split data 80:20. Sedangkan Information Gain mendapat nilai akurasi tertinggi 98,77% untuk split data 90:10.
Full Text:
PDFReferences
Wong, N. P., Damanik, F. N. S., Jaya, E. S., & Rajaya, R. (2019). Perbandingan Algoritma C4 . 5 dan Classification and Regression Tree ( CART ) Dalam Menyeleksi Calon Karyawan. 20(1), 11–18.
Elmande, Y., & Widodo, P. (2012). Pemilihan Criteria Splitting dalam Algoritma Iterative Dichotomiser 3 (ID3) untuk Penentuan Kualitas Beras: Studi Kasus Pada Perum Bulog Divre Lampung. Jurnal TELEMATIKA MKOM, 4(1), 10. Retrieved from http://demo.pohonkeputusan.com/files/PEMILIHAN CRITERIA SPLITTING DALAM ALGORITMA ITERATIVE DICHOTOMISER 3 (ID3) UNTUK PENENTUAN KUALITAS BERAS.pdf
Larose, D. T., & Larose, C. D. (2014). Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition. In Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition (Vol. 9780470908). https://doi.org/10.1002/9781118874059
Noviyanto, N. (2020). Penerapan Data Mining dalam Mengelompokkan Jumlah Kematian Penderita COVID-19 Berdasarkan Negara di Benua Asia. Paradigma - Jurnal Komputer Dan Informatika, 22(2), 183–188. https://doi.org/10.31294/p.v22i2.8808
Muningsih, E., Nur, H. M., Dwi Imaniawan, F. F., Saifudin, Handayani, V. R., & Endiarto, F. (2020). Comparative Analysis on Dimension Reduction Algorithm of Principal Component Analysis and Singular Value Decomposition for Clustering. Journal of Physics: Conference Series, 1641(1). https://doi.org/10.1088/1742-6596/1641/1/012101
Gustientiedina, G., Adiya, M. H., & Desnelita, Y. (2019). Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan. Jurnal Nasional Teknologi Dan Sistem Informasi, 5(1), 17–24. https://doi.org/10.25077/teknosi.v5i1.2019.17-24
Muningsih, E. (2015). Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop). Semantik, 157–161.
Wirdasari, D. (2013). ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA. Jurnal Ilmiah Saintikom Sains Dan Komputer, 12(2).
Gorunescu, F. (2011). Data mining: Concepts, models and techniques. In Intelligent Systems Reference Library (Vol. 12). https://doi.org/10.1007/978-3-642-19721-5
Rahayu, E. S., Satria, R., & Supriyanto, C. (2015). Penerapan Metode Average Gain, Threshold Pruning dan Cost Complexity Pruning Untuk Split Atribut Pada Algoritma C4.5. Journal of Intelligent Systems, 1(2), 91–97.
Zega, S. A. (2014). Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah. Seminar Nasional Aplikasi Teknologi Informasi (SNATI) Yogyakarta, 7–13.
Sastry, S. H., & Babu, P. M. S. P. (2013). Implementation of CRISP Methodology for ERP Systems. 2(05), 203–217. Retrieved from http://arxiv.org/abs/1312.2065
DOI: https://doi.org/10.33365/jti.v16i1.1561
Refbacks
- There are currently no refbacks.
Copyright (c) 2022 Elly Muningsih
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
JURNAL TEKNOINFO
Published by Universitas Teknokrat Indonesia
Organized by Prodi S1 Informatika FTIK Universitas Teknokrat Indonesia
W: http://ejurnal.teknokrat.ac.id/index.php/teknoinfo/index
E : teknoinfo@teknokrat.ac.id.
Jl. Zainal Abidin Pagaralam, No.9-11, Labuhan Ratu, Bandarlampung
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jumlah Pengunjung : View Teknoinfo StatsCounter