Perangkingan Dokumen Berbahasa Arab Menggunakan Latent Semantic Indexing
DOI:
https://doi.org/10.24002/jbi.v6i2.411Abstract
Berbagai metode perangkingan dokumen dalam aplikasi Information
Retrieval telah dikembangkan dan diimplementasikan. Salah satu metode yang
sangat populer adalah perangkingan dokumen menggunakan vector space model
berbasis pada nilai term weighting TF.IDF. Metode tersebut hanya melakukan
pembobotan term berdasarkan frekuensi kemunculannya pada dokumen tanpa
memperhatikan hubungan semantik antar term. Dalam kenyataannya hubungan
semantik antar term memiliki peranan penting untuk meningkatkan relevansi hasil
pencarian dokumen. Penelitian ini mengembangkan metode TF.IDF.ICF.IBF
dengan menambahkan Latent Semantic Indexing untuk menemukan hubungan
semantik antar term pada kasus perangkingan dokumen berbahasa Arab. Dataset
yang digunakan diambil dari kumpulan dokumen pada perangkat lunak Maktabah
Syamilah. Hasil pengujian menunjukkan bahwa metode yang diusulkan
memberikan nilai evaluasi yang lebih baik dibandingkan dengan metode
TF.IDF.ICF.IBF. Secara berurut nilai f-measure metode TF.IDF.ICF.IBF.LSI
pada ambang cosine similarity 0,3, 0,4, dan 0,5 adalah 45%, 51%, dan 60%.
Namun metode yang disulkan memiliki waktu komputasi rata-rata lebih tinggi
dibandingkan dengan metode TF.IDF.ICF.IBF sebesar 2 menit 8 detik.
Downloads
Published
Issue
Section
License
Copyright of this journal is assigned to Jurnal Buana Informatika as the journal publisher by the knowledge of author, whilst the moral right of the publication belongs to author. Every printed and electronic publications are open access for educational purposes, research, and library. The editorial board is not responsible for copyright violation to the other than them aims mentioned before. The reproduction of any part of this journal (printed or online) will be allowed only with a written permission from Jurnal Buana Informatika.
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.