Pendekatan Level Data Smote Pada Algoritma Bagging C4.5 Untuk Prediksi Cacat Software
Abstract
Prediksi cacat software merupakan salah satu fase atau tahap pengujian dalam Software Development Life Cycle. Proses pengujian software dapat mengidentifikasi apakah sebuah software mengandung cacat atau tidak. Pengujian menjadi standar dalam menghasilkan software yang berkualitas. Masalah utama dalam dataset software metrics adalah imbalance class yang menjadikan data tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas). Pendekatan level data Synthetic Minority Over-sampling Technique dan Bagging diusulkan untuk meningkatkan kinerja classifier C4.5 pada prediksi cacat software untuk menangani imbalance class. Model yang diusulkan diterapkan pada 12 NASA (National Aeronautics and Space Administration) MDP (Metrics Data Program) repository sebagai software metrics pada prediksi cacat software. model yang diusulkan mencapai akurasi dan AUC klasifikasi yang baik. Pada Model Synthetic Minority Over-sampling Technique (SMOTE)+Bagging+C4.5. Rata-rata Akurasi dan AUC meningkat dari model sebelumnya dimana akurasi meningkat sebesar 2.77% dan AUC meningkat sebesar 0.143 dan hasil tersebut berpengaruh terhadap tingkatan level kinerja klasifikasi yang didapat yang pada awalnya berada pada level “Failure Classification” karena berada pada rata-rata nilai AUC 0.50-0.60. Setelah dilakukannya integrasi pengujian model SMOTE+Bagging+C4.5 kinerja klasifikasi meningkat pada level “Fair Classification” dengan nilai rata-rata AUC 0.741.
Downloads
Abstract
Prediksi cacat software merupakan salah satu fase atau tahap pengujian dalam Software Development Life Cycle. Proses pengujian software dapat mengidentifikasi apakah sebuah software mengandung cacat atau tidak. Pengujian menjadi standar dalam menghasilkan software yang berkualitas. Masalah utama dalam dataset software metrics adalah imbalance class yang menjadikan data tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas). Pendekatan level data Synthetic Minority Over-sampling Technique dan Bagging diusulkan untuk meningkatkan kinerja classifier C4.5 pada prediksi cacat software untuk menangani imbalance class. Model yang diusulkan diterapkan pada 12 NASA (National Aeronautics and Space Administration) MDP (Metrics Data Program) repository sebagai software metrics pada prediksi cacat software. model yang diusulkan mencapai akurasi dan AUC klasifikasi yang baik. Pada Model Synthetic Minority Over-sampling Technique (SMOTE)+Bagging+C4.5. Rata-rata Akurasi dan AUC meningkat dari model sebelumnya dimana akurasi meningkat sebesar 2.77% dan AUC meningkat sebesar 0.143 dan hasil tersebut berpengaruh terhadap tingkatan level kinerja klasifikasi yang didapat yang pada awalnya berada pada level “Failure Classification” karena berada pada rata-rata nilai AUC 0.50-0.60. Setelah dilakukannya integrasi pengujian model SMOTE+Bagging+C4.5 kinerja klasifikasi meningkat pada level “Fair Classification” dengan nilai rata-rata AUC 0.741.
References
Hall, T., Beecham, S., Bowes, D., Gray, D., & Counsell, S. (2012). A Systematic Literature Review on Fault Prediction Performance in Software Engineering. IEEE TRANSACTIONS ON SOFTWARE ENGINEERING, 38(6), 1276–1304.
Hardoni, A., Rini, D. P., & Sukemi, S. (2021). Integrasi SMOTE pada Naive Bayes dan Logistic Regression Berbasis Particle Swarm Optimization untuk Prediksi Cacat Perangkat Lunak. Jurnal Media Informatika Budidarma, 5(1), 233. https://doi.org/10.30865/mib.v5i1.2616
Hidayati, N., Suntoro, J., & Setiaji, G. G. (2021). Perbandingan Algoritma Klasifikasi untuk Prediksi Cacat Software dengan Pendekatan CRISP-DM. Jurnal Sains Dan Informatika, 7(2), 117–126. https://doi.org/10.34128/jsi.v7i2.313
Ichsan, N. (2019). Metoda Distribution Based Balance dan Bagging C4 . 5. Indonesian Journal on Computer and Information Technology, 4(2), 215–224.
Ichsan, N., Fatah, H., Ermawati, E., Indriyanti, I., & Wahyuni, T. (2022). Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes Untuk Prediksi Cacat Software. Media Jurnal Informatika, 14(2), 79. https://doi.org/10.35194/mji.v14i2.2623
Prasetyo, R., Nawawi, I., Fauzi, A., & Ginabila, G. (2021). Komparasi Algoritma Logistic Regression dan Random Forest pada Prediksi Cacat Software. Jurnal Teknik Informatika UNIKA Santo Thomas, 06(Siringoringo 2017), 275–281. https://doi.org/10.54367/jtiust.v6i2.1522
Putri, S. A. (2019). Prediksi Cacat Software Dengan Teknik Sampel Dan Seleksi Fitur Pada Bayesian Network. Jurnal Kajian Ilmiah, 19(1), 17. https://doi.org/10.31599/jki.v19i1.314
Sugiono, Taufik, A., & Faizal Amir, R. (2020). Penerapan Penerapan Teknik Pso Over Sampling Dan Adaboost J48 Untuk Memprediksi Cacat Software. Jurnal Responsif : Riset Sains Dan Informatika, 2(2), 198–203. https://doi.org/10.51977/jti.v2i2.249
Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks. Journal of Software Engineering, 1(1).