Rancang Bangun Information Retrieval System (IRS) Bahasa Jawa Ngoko pada Palintangan Penjebar Semangad dengan Metode Vector Space Model (VSM)

  • Fatkhul Amin
  • Purwatiningtyas .

Abstract

Bahasa Jawa adalah bahasa daerah yang paling banyak digunakan di Indonesia yang mulai ditinggalkan.  Perlunya pelestarian bahasa jawa dalam bentuk online yang bisa diakses bagi penggunanya sehingga akanmemudahkan dalam pencarian dokumen teks khususnya dokumen bahasa jawa ngoko.  Software IRS dirancang untuk memberikan hasil pencarian dokumen dalam jumlah yang optimal (recall rendah) dan akurat (precision tinggi) menggunakan metode VSM, sehingga user akan mendapatkan hasil pencarian cepat dan akurat.  Metode VSM akan melakukan pembobotan tiap dokumen yang ada pada database sehingga antar dokumen memiliki bobot yang berbeda untuk menentukan dokumen mana yang paling mirip (similar) dengan query, dokumen dengan bobot tertinggi menempati ranking teratas dalam hasil pencarian.  Evaluasi hasil pencarian IRS dilakukan dengan uji recall dan precision. Studi kasus yang telah dilakukan menggunakan IRS  ini didapatkan hasil sistem mampu melakukan proses preprosesing (tokenisasi, filtering, dan stemming) dengan waktu komputasi 18 detik. Sistem mampu melakukan pencarian dokumen dan menampilkan hasil pencarian dokumen dalam waktu komputasi rata-rata 2 detik, memiliki  rata-rata recall 0,04 dan rata-rata precision 0,84. Sistem dilengkapi dengan bobot tiap dokumen dan letakknya yang akan memudahkan user dalam pencarian dokumen teks bahasa Indonesia.

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed