Istilah di dalam Sistem Temu-Balik Informasi (Information Retrieval)

Thursday, December 29, 2011

Berikut ini adalah istilah-istilah yang terdapat di dalam Information Retrieval. Daftar di bawah ini memang belum lengkap, penulis akan berusaha untuk memperpanjang daftar istilah yang sudah ada.

  • Case-folding : Proses penyamaan case dalam suatu dokumen. 
  • Index Construction : proses membangun index dokumen dalam korpus data yang akan digunakan dalam proses retrieval.
  • Information Retrievalteknik dan proses searching, recovering, dan interpreting informasi dari banyak sekali data yang tersimpan.
  • Korpus / Korpus Data : Koleksi dokumen dalam Information Retrieval.
  • Stop Word : Kata-kata umum dalam dokumen, kata tersebut diabaikan dalam proses indexing karena tidak mempengaruhi isi dokumen. Misalnya dalam bahasa Indonesia : untuk, yang, jika, pada, dll; dalam bahasa Inggris : for, than, is, the, dll.
  • Token / Terms / Words : Kata yang terdapat di dalam suatu Korpus Data.
  • Tokenisasi : Proses pemotongan sebuah dokumen menjadi bagian-bagian yang disebut token. Tanda baca tidak dimasukkan ke dalam token.
 
Copyright © 2016. syamsularies.
Design by Herdiansyah Hamzah. & Distributed by Free Blogger Templates
Creative Commons License