PENINGKATAN HASIL SISTEM TEMU KEMBALI INFORMASI BERBASIS PADA KATA MAJEMUK MENGGUNAKAN JACCARD SIMILARITY

  • Dwi Agus Diartono Universitas Stikubank
  • Isworo Nugroho Universitas Stikubank
  • Jeffri Alfa Razaq Universitas Stikubank

Abstract

Kata majemuk gabungan morfem dasar yang kesemuanya berstatus kata dengan pola fonetik, gramatikal, dan semantik tertentu sesuai dengan kaidah bahasa yang bersangkutan. Pola khusus ini membedakannya dari frasa atau kombinasi kata—kombinasi morfem yang bukan kata majemuk. Pembatasan ini berlaku untuk sejumlah dimensi, dan persamaan kosinus paling sering digunakan dalam ruang positif berdimensi tinggi. Misalnya, dalam pencarian informasi dan penambangan teks, setiap istilah secara tidak langsung diberi dimensi yang berbeda, dan dokumen diberi label sebagai vektor, di mana nilai di setiap dimensi sesuai dengan berapa kali istilah tersebut muncul dalam dokumen. Kesamaan cosine kemudian memberikan ukuran yang berguna tentang seberapa mirip dua dokumen dalam hal topik. Pada penelitian ini penggunaan kata majemuk sebagai kata kunci dalam pencarian dokumen menghasilkan dokumen yang lebih tepat. Data yang digunakan sebanyak 15 file. Data yang mengandung kata majemuk sebanyak 10 file. Data 5 dokumen tanpa kata majemuk. Hasil pencarian dengan menggunakan algoritma kesamaan menghasilkan nilai kesamaan yang tinggi, namun 33,3% kata majemuk tidak ada. Dan hasil pencarian dengan nilai kemiripan lebih rendah tetapi mengandung kata majemuk sebesar 66,3%. Sehingga dengan adanya penambahan data berupa kata majemuk di dalam pencarian membuat hasilnya lebih baik.

 

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed