Aplikasi untuk Membangun Corpus dari Data Hasil Crawling dengan Berbagai Format Data Secara Otomatis

  • Jati Sasongko

Abstract

Aplikasi membangun corpus dengan berbagai format data dibangun dari beberapa proses atau modul
sehingga membentuk aplikasi yang befungsi untuk membangun sebuah corpus. Proses-proses yang terdapat
pada aplikasi membangun corpus terdiri dari : pengumpulan data file teks dan image (crawling), poses
pencarian file teks dan image dalam folder atau direktori (searching), proses input data file teks dan image ke
database (corpus), proses pengindeksan (indexing).
Aplikasi mampu menampilkan hasil pencarian dokumen dan mengurutkannya berdasarkan urutan dari
penemuan dari file data yang dicari, dalam arti dokumen data yang ditemukan pertama kali akan ditempatkan
diurutan pertama sedangkan dokumen data yang ditemukan terakhir akan ditempatkan pada urutan paling
bawah. Aplikasi juga mampu melakukan konversi dari dokumen teks dengan berbagai format data ke dalam
bentuk dokumen teks txt, juga dalam melakukan konversi pada semua format file image ke dalam bentuk
format bmp. Konversi dilakukan untuk menyamakan format untuk dapat mempermudah dalam penyimpanan
dalam database.

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed