KOMBINASI METODE K-MEANS DAN DECISION TREE DENGAN PERBANDINGAN KRITERIA DAN SPLIT DATA

Elly Muningsih

Abstract


Data mining merupakan suatu proses mencari pola atau menarik informasi data besar dan terpilih menggunakan teknik atau metode tertentu. Metode K-Means dan Decision Tree merupakan bagian dari teknik Data Mining. Penelitian ini akan mengkombinasikan metode K-Means untuk melakukan clustering data menjadi 3 cluster kemudian hasil dari clustering akan di klasifikasi menggunakan Metode Decision Tree dengan perbandingan kriteria Gain Ratio, Information Gain dan Gini Index. Data yang diolah di bagi (split) menjadi 2 yaitu data training dan data testing dengan prosentase 70:30, 80:20 dan 90:10. Hasil dari penelitian untuk menemukan kriteria mana yang menghasilkan pohon keputusan dan performa terbaik berdasarkan nilai akurasi tertinggi dari masing-masing kelompok data. Data diambil dari Repository UCI dengan jumlah 811 record dan 52 atribut. Dari pengolahan data yang dilakukan diketahui Untuk split data 70:30, nilai akurasi dengan kriteria Gain Ratio, Information Gain dan Gini Index mendapatkan nilai sama yaitu 97,53. Kriteria Gain Ratio dan Gini Index menghasilkan nilai akurasi tertinggi yaitu 98,15% untuk split data 80:20. Sedangkan Information Gain mendapat nilai akurasi tertinggi 98,77%  untuk split data 90:10. 


Full Text:

PDF

References


Wong, N. P., Damanik, F. N. S., Jaya, E. S., & Rajaya, R. (2019). Perbandingan Algoritma C4 . 5 dan Classification and Regression Tree ( CART ) Dalam Menyeleksi Calon Karyawan. 20(1), 11–18.

Elmande, Y., & Widodo, P. (2012). Pemilihan Criteria Splitting dalam Algoritma Iterative Dichotomiser 3 (ID3) untuk Penentuan Kualitas Beras: Studi Kasus Pada Perum Bulog Divre Lampung. Jurnal TELEMATIKA MKOM, 4(1), 10. Retrieved from http://demo.pohonkeputusan.com/files/PEMILIHAN CRITERIA SPLITTING DALAM ALGORITMA ITERATIVE DICHOTOMISER 3 (ID3) UNTUK PENENTUAN KUALITAS BERAS.pdf

Larose, D. T., & Larose, C. D. (2014). Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition. In Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition (Vol. 9780470908). https://doi.org/10.1002/9781118874059

Noviyanto, N. (2020). Penerapan Data Mining dalam Mengelompokkan Jumlah Kematian Penderita COVID-19 Berdasarkan Negara di Benua Asia. Paradigma - Jurnal Komputer Dan Informatika, 22(2), 183–188. https://doi.org/10.31294/p.v22i2.8808

Muningsih, E., Nur, H. M., Dwi Imaniawan, F. F., Saifudin, Handayani, V. R., & Endiarto, F. (2020). Comparative Analysis on Dimension Reduction Algorithm of Principal Component Analysis and Singular Value Decomposition for Clustering. Journal of Physics: Conference Series, 1641(1). https://doi.org/10.1088/1742-6596/1641/1/012101

Gustientiedina, G., Adiya, M. H., & Desnelita, Y. (2019). Penerapan Algoritma K-Means Untuk Clustering Data Obat-Obatan. Jurnal Nasional Teknologi Dan Sistem Informasi, 5(1), 17–24. https://doi.org/10.25077/teknosi.v5i1.2019.17-24

Muningsih, E. (2015). Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop). Semantik, 157–161.

Wirdasari, D. (2013). ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA. Jurnal Ilmiah Saintikom Sains Dan Komputer, 12(2).

Gorunescu, F. (2011). Data mining: Concepts, models and techniques. In Intelligent Systems Reference Library (Vol. 12). https://doi.org/10.1007/978-3-642-19721-5

Rahayu, E. S., Satria, R., & Supriyanto, C. (2015). Penerapan Metode Average Gain, Threshold Pruning dan Cost Complexity Pruning Untuk Split Atribut Pada Algoritma C4.5. Journal of Intelligent Systems, 1(2), 91–97.

Zega, S. A. (2014). Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah. Seminar Nasional Aplikasi Teknologi Informasi (SNATI) Yogyakarta, 7–13.

Sastry, S. H., & Babu, P. M. S. P. (2013). Implementation of CRISP Methodology for ERP Systems. 2(05), 203–217. Retrieved from http://arxiv.org/abs/1312.2065




DOI: https://doi.org/10.33365/jti.v16i1.1561

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Elly Muningsih

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


JURNAL TEKNOINFO
Published by Universitas Teknokrat Indonesia
Organized by Prodi S1 Informatika FTIK Universitas Teknokrat Indonesia

W: http://ejurnal.teknokrat.ac.id/index.php/teknoinfo/index
E : teknoinfo@teknokrat.ac.id.
Jl. Zainal Abidin Pagaralam, No.9-11, Labuhan Ratu, Bandarlampung

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jumlah Pengunjung : View Teknoinfo StatsCounter

Flag Counter