Pendekatan Level Data Smote Pada Algoritma Bagging C4.5 Untuk Prediksi Cacat Software

  • Suhardi Suhardi Universitas Bina Sarana Informatika
  • Nurul Ichsan Universitas Bina Sarana Informatika
  • Robi Sopandi Universitas Nusa Mandiri
  • Hananda Priyandaru Universitas Bina Sarana Informatika
  • Muhamad Tabrani Universitas Bina Sarana Informatika

Abstract

Prediksi cacat software merupakan salah satu fase atau tahap pengujian dalam Software Development Life Cycle. Proses pengujian software dapat mengidentifikasi apakah sebuah software mengandung cacat atau tidak. Pengujian menjadi standar dalam menghasilkan software yang berkualitas. Masalah utama dalam dataset software metrics adalah imbalance class yang menjadikan data tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas). Pendekatan level data Synthetic Minority Over-sampling Technique dan Bagging diusulkan untuk meningkatkan kinerja classifier C4.5 pada prediksi cacat software untuk  menangani  imbalance  class. Model  yang  diusulkan diterapkan  pada  12  NASA  (National Aeronautics and Space Administration) MDP (Metrics Data Program) repository sebagai software metrics  pada  prediksi cacat software. model yang diusulkan mencapai akurasi dan AUC klasifikasi yang baik. Pada Model Synthetic Minority Over-sampling Technique (SMOTE)+Bagging+C4.5. Rata-rata Akurasi dan AUC meningkat dari model sebelumnya dimana akurasi meningkat sebesar 2.77% dan AUC meningkat sebesar 0.143 dan hasil tersebut berpengaruh terhadap tingkatan level kinerja klasifikasi yang didapat yang pada awalnya berada pada level “Failure Classification” karena berada pada rata-rata nilai AUC 0.50-0.60. Setelah dilakukannya integrasi pengujian model SMOTE+Bagging+C4.5 kinerja klasifikasi meningkat pada level “Fair Classification” dengan nilai rata-rata AUC 0.741.

Downloads

Download data is not yet available.

Abstract

Prediksi cacat software merupakan salah satu fase atau tahap pengujian dalam Software Development Life Cycle. Proses pengujian software dapat mengidentifikasi apakah sebuah software mengandung cacat atau tidak. Pengujian menjadi standar dalam menghasilkan software yang berkualitas. Masalah utama dalam dataset software metrics adalah imbalance class yang menjadikan data tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas). Pendekatan level data Synthetic Minority Over-sampling Technique dan Bagging diusulkan untuk meningkatkan kinerja classifier C4.5 pada prediksi cacat software untuk  menangani  imbalance  class. Model  yang  diusulkan diterapkan  pada  12  NASA  (National Aeronautics and Space Administration) MDP (Metrics Data Program) repository sebagai software metrics  pada  prediksi cacat software. model yang diusulkan mencapai akurasi dan AUC klasifikasi yang baik. Pada Model Synthetic Minority Over-sampling Technique (SMOTE)+Bagging+C4.5. Rata-rata Akurasi dan AUC meningkat dari model sebelumnya dimana akurasi meningkat sebesar 2.77% dan AUC meningkat sebesar 0.143 dan hasil tersebut berpengaruh terhadap tingkatan level kinerja klasifikasi yang didapat yang pada awalnya berada pada level “Failure Classification” karena berada pada rata-rata nilai AUC 0.50-0.60. Setelah dilakukannya integrasi pengujian model SMOTE+Bagging+C4.5 kinerja klasifikasi meningkat pada level “Fair Classification” dengan nilai rata-rata AUC 0.741.

References

Amir, R. F., Sobari, I. A., & Rousyati, R. (2020). Penerapan PSO Over Sampling Dan Adaboost Random Forest Untuk Memprediksi Cacat Software. Indonesian Journal on Software Engineering (IJSE), 6(2), 230–239. https://doi.org/10.31294/ijse.v6i2.9258

Hall, T., Beecham, S., Bowes, D., Gray, D., & Counsell, S. (2012). A Systematic Literature Review on Fault Prediction Performance in Software Engineering. IEEE TRANSACTIONS ON SOFTWARE ENGINEERING, 38(6), 1276–1304.

Hardoni, A., Rini, D. P., & Sukemi, S. (2021). Integrasi SMOTE pada Naive Bayes dan Logistic Regression Berbasis Particle Swarm Optimization untuk Prediksi Cacat Perangkat Lunak. Jurnal Media Informatika Budidarma, 5(1), 233. https://doi.org/10.30865/mib.v5i1.2616

Hidayati, N., Suntoro, J., & Setiaji, G. G. (2021). Perbandingan Algoritma Klasifikasi untuk Prediksi Cacat Software dengan Pendekatan CRISP-DM. Jurnal Sains Dan Informatika, 7(2), 117–126. https://doi.org/10.34128/jsi.v7i2.313

Ichsan, N. (2019). Metoda Distribution Based Balance dan Bagging C4 . 5. Indonesian Journal on Computer and Information Technology, 4(2), 215–224.

Ichsan, N., Fatah, H., Ermawati, E., Indriyanti, I., & Wahyuni, T. (2022). Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes Untuk Prediksi Cacat Software. Media Jurnal Informatika, 14(2), 79. https://doi.org/10.35194/mji.v14i2.2623

Prasetyo, R., Nawawi, I., Fauzi, A., & Ginabila, G. (2021). Komparasi Algoritma Logistic Regression dan Random Forest pada Prediksi Cacat Software. Jurnal Teknik Informatika UNIKA Santo Thomas, 06(Siringoringo 2017), 275–281. https://doi.org/10.54367/jtiust.v6i2.1522

Putri, S. A. (2019). Prediksi Cacat Software Dengan Teknik Sampel Dan Seleksi Fitur Pada Bayesian Network. Jurnal Kajian Ilmiah, 19(1), 17. https://doi.org/10.31599/jki.v19i1.314

Sugiono, Taufik, A., & Faizal Amir, R. (2020). Penerapan Penerapan Teknik Pso Over Sampling Dan Adaboost J48 Untuk Memprediksi Cacat Software. Jurnal Responsif : Riset Sains Dan Informatika, 2(2), 198–203. https://doi.org/10.51977/jti.v2i2.249

Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks. Journal of Software Engineering, 1(1).
Published
2023-12-18
How to Cite
SUHARDI, Suhardi et al. Pendekatan Level Data Smote Pada Algoritma Bagging C4.5 Untuk Prediksi Cacat Software. CERMIN: Jurnal Penelitian, [S.l.], v. 7, n. 2, p. 402-416, dec. 2023. ISSN 2615-3238. Available at: <https://unars.ac.id/ojs/index.php/cermin_unars/article/view/3782>. Date accessed: 29 july 2024. doi: https://doi.org/10.36841/cermin_unars.v7i2.3782.