IMPLEMENTASI SELEKSI FITUR INFORMATION GAIN RATIO PADA ALGORITMA RANDOM FOREST UNTUK MODEL DATA KLASIFIKASI PEMBAYARAN KULIAH

  • Taghfirul Azhima Yoga Siswa Universitas Muhammadiyah Kalimantan Timur
  • Wawan Joko Pranoto

Abstract

Perguruan tinggi swasta merupakan salah satu lembaga pendidikan dengan pembiayaan operasional utamanya dibebankan kepada mahasiswa melalui Sumbangan Pembangunan Pendidikan (SPP). Oleh karena itu, keterlambatan dari pembayaran SPP tentunya sangat berpengaruh signifikan bagi keberlangsungan aktivitas perguruan tinggi. Salah satu pendekatan data analisis yang bisa dilakukan adalah data mining dengan pemanfaatan algoritma random forest. Random forest merupakan metode yang biasa digunakan untuk menyelesaikan masalah yang berhubungan dengan klasifikasi dan regresi. Penelitian ini bertujuan mengimplementasikan dan mengevaluasi hasil kinerja algoritma random forest melalui pendekatan seleksi fitur information gain ratio dengan pembagian data training sebesar 90% dan data testing sebesar 10% dan dievaluasi menggunakan confusion matrix menggunakan rapidminer. Data yang digunakan dalam penelitian ini berupa data pembayaran SPP mahasiswa pada tahun 2019-2021 yang berasal dari Biro Administrasi Akademik dan Administrasi Keuangan yang berjumlah 12.408 record data. Hasil evaluasi kinerja seleksi fitur information gain ratio pada algoritma random forest menghasilkan nilai akurasi sebesar 78,47%. Atribut yang memiliki pengaruh dalam klasifikasi keterlambatan pembayaran SPP antara lain : fakultas, prodi, angkatan, gender penghasilan ayah, dan penghasilan ibu.

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed