Pemodelan Deteksi Dini Diabetes Mellitus menggunakan Pendekatan Ensemble Learning
DOI:
https://doi.org/10.47134/mpk.v1i1.2924Keywords:
Deteksi dini, Diabetes Mellitus, Rapidminer, Klasifikasi, Random ForestAbstract
Diabetes Mellitus ditandai dengan hiperglikemia yang disebabkan oleh pankreas yang tidak dapat memproduksi insulin dengan baik. Diabetes memiliki gejala tahap awal yang dapat dijadikan sebagai tolak ukur seseorang terprediksi Diabetes Mellitus atau tidak. Berdasarkan data Rumah Sakit Umum Daerah Sidoarjo, kasus Diabetes menginjak urutan keempat terbanyak dari 10 penyakit terbesar yang ada di Rumah Sakit Umum Daerah Sidoarjo. Data yang digunakan merupakan data pada tahun 2022–2023 dengan atribut yang terpilih. Tujuan penelitian ini yaitu untuk mendeteksi dini gejala awal Diabetes Mellitus tipe 2 dimana terdapat 5 tanda yang terdeteksi sangat akurat. Anotasi data dilakukan oleh tenaga paramedis yang kompeten di bidangnya. Penelitian ini menggunakan metode klasifikasi ensemble learning dengan alat bantu Rapidminer untuk dan melakukan uji training dan uji testing dengan perbandingan 60:40 pada operator split data serta menambah performance untuk menghasilkan nilai akurasi. Hasil yang didaptakan berupa hasil evaluasi dengan tingkat akurasi Random Forest 87.30% yang dimana tingkat akurasi tersebut dapat dikateogorikan sebagai excellent classification.
References
Aggarwal, C. C. (2015). Data Mining: The Textbook. Cham: Springer International Publishing. https://doi.org/10.1007/978-3-319-14142-8 DOI: https://doi.org/10.1007/978-3-319-14142-8
Aidia, A. K. F., Amelia, P. J., & Setyaning Nastiti, V. R. (2022). Prediksi Jumlah Pasien Covid-19 Dengan Menggunakan Klasifikasi Algoritma Machine Learning. Sintech: Science and Information Technology Journal, 5(2), 165–172. https://doi.org/10.31598/sintechjournal.v5i2.1163 DOI: https://doi.org/10.31598/sintechjournal.v5i2.1163
Argina, A. M. (2020). Penerapan Metode Klasifikasi K-Nearest Neighbor pada Dataset Penderita Penyakit Diabetes. Indonesian Journal of Data Science, 1(2), 29–33. https://doi.org/10.33096/ijodas.v1i2.11 DOI: https://doi.org/10.33096/ijodas.v1i2.11
Aris, F. (2019). Penerapan Data Mining untuk Identifikasi Penyakit Diabetes Melitus dengan Menggunakan Metode Klasifikasi. Indonesian Journal of Data Science, 1(1), 19.
Astuti, F. D., & Lenti, F. N. (2021). Implementasi SMOTE untuk Mengatasi Imbalance Class pada Klasifikasi Car Evolution Menggunakan K-NN. Jurnal Informatika: Jurnal Ilmu Komputer, 13(1), 2021.
Apriliah, W., Kurniawan, I., Baydhowi, M., & Haryati, T. (2021). Prediksi Kemungkinan Diabetes pada Tahap Awal Menggunakan Algoritma Klasifikasi Random Forest. Sistemasi, 10(1), 163. https://doi.org/10.32520/stmsi.v10i1.1129 DOI: https://doi.org/10.32520/stmsi.v10i1.1129
Azhari, M., Situmorang, Z., & Rosnelly, R. (2021). Perbandingan Akurasi, Recall, dan Presisi Klasifikasi pada Algoritma C4.5, Random Forest, SVM dan Naive Bayes. Jurnal Media Informatika Budidarma, 5(2), 640. https://doi.org/10.30865/mib.v5i2.2937 DOI: https://doi.org/10.30865/mib.v5i2.2937
Bessy, S. (2018, November 2). Hasil Riskesdas 2018 Kemestrian Kesehatan. Presented at Hasil Riskesdas, Kemkes. Retrieved from https://kesmas.kemkes.go.id/assets/upload/dir_519d41d8cd98f00/files/Hasil-riskesdas-2018_1274.pdf
Cavalin, P., & Oliveira, L. (2019). Confusion Matrix-Based Building of Hierarchical Classification. In R. Vera-Rodriguez, J. Fierrez, & A. Morales (Eds.), Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications (Vol. 11401, pp. 271–278). Cham: Springer International Publishing. https://doi.org/10.1007/978-3-030-13469-3_32 DOI: https://doi.org/10.1007/978-3-030-13469-3_32
Depari, D. H., Widiastiwi, Y., & Santoni, M. M. (2022). Perbandingan Model Decision Tree, Naive Bayes dan Random Forest untuk Prediksi Klasifikasi Penyakit Jantung. Informatika: Jurnal Ilmu Komputer, 18(3), 239. https://doi.org/10.52958/iftk.v18i3.4694 DOI: https://doi.org/10.52958/iftk.v18i3.4694
Doni, B. T. R., Susanti, S., & Mubarok, A. (2021). Penerapan Data Mining Untuk Klasifikasi Penyakit Hepatocellular Carcinoma Menggunakan Algoritma Naïve Bayes. Jurnal Responsif: Riset Sains dan Informatika, 3(1), 12–19. https://doi.org/10.51977/jti.v3i1.403 DOI: https://doi.org/10.51977/jti.v3i1.403
Elfaladonna, F., & Rahmadani, A. (2019). Analisa Metode Classification-Decision Tree dan Algoritma C4.5 untuk Memprediksi Penyakit Diabetes dengan Menggunakan Aplikasi Rapid Miner. Sintech: Science and Information Technology Journal, 2(1), 10–17. https://doi.org/10.31598/sintechjournal.v2i1.293 DOI: https://doi.org/10.31598/sintechjournal.v2i1.293
Ente, D. R., Thamrin, S. A., Arifin, S., Kuswanto, H., & Andreza, A. (2020). Klasifikasi Faktor-Faktor Penyebab Penyakit Diabetes Melitus di Rumah Sakit Unhas Menggunakan Algoritma C4.5. Indonesian Journal of Statistics and Its Applications, 4(1), 80–88. https://doi.org/10.29244/ijsa.v4i1.330 DOI: https://doi.org/10.29244/ijsa.v4i1.330
Ghorbani, R., & Ghousi, R. (2019). Predictive Data Mining Approaches in Medical Diagnosis: A Review of Some Diseases Prediction. International Journal of Data and Network Science, 47–70. https://doi.org/10.5267/j.ijdns.2019.1.003 DOI: https://doi.org/10.5267/j.ijdns.2019.1.003
Gorunescu, F. (2011). Data Mining (Vol. 12). Berlin, Heidelberg: Springer Berlin Heidelberg. https://doi.org/10.1007/978-3-642-19721-5 DOI: https://doi.org/10.1007/978-3-642-19721-5
Krstinić, D., Braović, M., Šerić, L., & Božić-Štulić, D. (2019). Multi-Label Classifier Performance Evaluation with Confusion Matrix. Computer Science. DOI: https://doi.org/10.5121/csit.2020.100801
Magliano, D., & Boyko, E. J. (2021). IDF Diabetes Atlas, 10th Edition. Brussels: International Diabetes Federation.
Nyarko, B. E., Amoah, R. S., & Crimi, A. (2019). Boosting Diabetes and Pre-Diabetes Detection in Rural Ghana [Version 2; Peer Review: 2 Approved]. F1000 Research, 8, 19. https://doi.org/10.12688/f1000research.18497.2 DOI: https://doi.org/10.12688/f1000research.18497.2
Nugraha, W., & Sabaruddin, R. (2021). Teknik Resampling untuk Mengatasi Ketidakseimbangan Kelas pada Klasifikasi Penyakit Diabetes Menggunakan C4.5, Random Forest, dan SVM. Techno.Com, 20(3), 352–361. https://doi.org/10.33633/tc.v20i3.4762 DOI: https://doi.org/10.33633/tc.v20i3.4762
Ozougwu, O. (2013). The Pathogenesis and Pathophysiology of Type 1 and Type 2 Diabetes Mellitus. Journal of Physiology and Pathophysiology, 4(4), 46–57. https://doi.org/10.5897/JPAP2013.0001 DOI: https://doi.org/10.5897/JPAP2013.0001
Ridwan, A. (2020). Penerapan Algoritma Naïve Bayes Untuk Klasifikasi Penyakit Diabetes Mellitus. Jurnal SISKOM-KB Sistem Komputasi dan Kecerdasan Buatan, 4(1), 15–21. https://doi.org/10.47970/siskom-kb.v4i1.169 DOI: https://doi.org/10.47970/siskom-kb.v4i1.169
Subarkah, P. (2020). Penerapan Algoritme Klasifikasi Classification And Regression Trees (CART) Untuk Diagnosis Penyakit Diabetes Retinopathy. Matrik: Jurnal Manajemen Teknologi Informasi dan Rekayasa Komputer, 19(2), 294–301. https://doi.org/10.30812/matrik.v19i2.676 DOI: https://doi.org/10.30812/matrik.v19i2.676
Syukron, M., Santoso, R., & Widiharih, T. (2020). Perbandingan Metode SMOTE Random Forest dan SMOTE XGBoost untuk Klasifikasi Tingkat Penyakit Hepatitis C pada Imbalance Class Data. Jurnal Gaussian, 9(3), 227–236. https://doi.org/10.14710/j.gauss.v9i3.28915 DOI: https://doi.org/10.14710/j.gauss.v9i3.28915
Tarawneh, M., & Embarak, O. (2019). Hybrid Approach for Heart Disease Prediction Using Data Mining Techniques. In L. Barolli, F. Xhafa, Z. A. Khan, & H. Odhabi (Eds.), Advances in Internet, Data and Web Technologies (Vol. 29, pp. 447–454). Cham: Springer International Publishing. https://doi.org/10.1007/978-3-030-12839-5_41 DOI: https://doi.org/10.1007/978-3-030-12839-5_41
Yusnaeni, W., & Widiarina, W. (2022). Penerapan Algoritma C4.5 Dalam Prediksi Resiko Diabetes Tahap Awal (Early Stage Diabetes). Jurnal Teknik Komputer, 8(1), 56–60. https://doi.org/10.31294/jtk.v8i1.11566 DOI: https://doi.org/10.31294/jtk.v8i1.11566