0
Algoritma Stemming (Pencarian kata dasar) Nazief dan Adriani untuk Bahasa Indonesia di C# (Csharp)
Posted by jujur
on
9:40 AM
Algoritma Stemming (Pencarian kata dasar) Nazief dan Adriani untuk Bahasa Indonesia di C# (Csharp)
Algoritma
Nazief dan Andriani. Merupakan sebuah algoritma untuk mencari sebuah
kata dasar atau lebih dikena dengan istilah stemming. Proses stemming
antara satu bahasa tidak sama dengan proses stemming dengan bahasa lain,
dengan kata lain algoritma stemming untuk bahasa indonesia tidak dapat
digunakan untuk proses stemming bahasa inggris atau bahasa lainnya
karena masing-masing bahasa mempunyai struktur morfologi yang berbeda.
Algoritma Nazief dan Adriani adalah algoritma stemming yang digunakan
khusus untuk bahasa indonesia, walaupun ada banyak algoritma stemming
lainnya untuk bahasa indonesia, akan tetapi Nazief dan Adriani lebih
banyak digunakan oleh para praktisi maupun para pegiat akademik, karena
memang sampai saat ini Nazief dan Adriani mempunyai akurat yang baik
jika dibandingkan dengan yang lainnya.
Berikut ini adalah algoritma Nazief dan Adriani.
perlu
diketahui sebelumnya, bahwa untuk membuat algoritma Nazief dan Adriani
ini membutuhkan sebuah list kata dasar, sehingga bisa menggunakan
bantuan database atau array di program itu sendiri, akan tetapi pada
tutorial ini list kata dasar bahasa indonesia disimpan di database
MYSQL.
Algoritma Nazief dan Adriani ini memiliki beberapa function utama seperti dibawah ini
- Function cekKataDasar(string)
- Function HapusAkhran(string)
- Function HapusAkhiranKepunyaan(string)
- Function HapusAkhiranIAnKan(string)
- Function hapus_derivation_prefix(string)
- Function Stemming(string)
Gambar 1. Hasil running program
Dari program diatas terlihat bahwa kata yang diinputkan adalah kata "Kegiatan" akan tetapi setelah dilakukan proses stemming hasilnya adalah "giat".
sumber : http://www.csharp-indonesia.com/