Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing

Authors

  • Aminul Wahib
  • Pasnur Pasnur
  • Putu Praba Santika
  • Agus Zainal Arifin

DOI:

https://doi.org/10.24002/jbi.v6i2.411

Abstract

Berbagai metode perangkingan dokumen dalam aplikasi Information
Retrieval telah dikembangkan dan diimplementasikan. Salah satu metode yang
sangat populer adalah perangkingan dokumen menggunakan vector space model
berbasis pada nilai term weighting TF.IDF. Metode tersebut hanya melakukan
pembobotan term berdasarkan frekuensi kemunculannya pada dokumen tanpa
memperhatikan hubungan semantik antar term. Dalam kenyataannya hubungan
semantik antar term memiliki peranan penting untuk meningkatkan relevansi hasil
pencarian dokumen. Penelitian ini mengembangkan metode TF.IDF.ICF.IBF
dengan menambahkan Latent Semantic Indexing untuk menemukan hubungan
semantik antar term pada kasus perangkingan dokumen berbahasa Arab. Dataset
yang digunakan diambil dari kumpulan dokumen pada perangkat lunak Maktabah
Syamilah. Hasil pengujian menunjukkan bahwa metode yang diusulkan
memberikan nilai evaluasi yang lebih baik dibandingkan dengan metode
TF.IDF.ICF.IBF. Secara berurut nilai f-measure metode TF.IDF.ICF.IBF.LSI
pada ambang cosine similarity 0,3, 0,4, dan 0,5 adalah 45%, 51%, dan 60%.
Namun metode yang disulkan memiliki waktu komputasi rata-rata lebih tinggi
dibandingkan dengan metode TF.IDF.ICF.IBF sebesar 2 menit 8 detik.

Downloads

Published

2015-05-01