Algoritma Levenshtein

Beberapa waktu yang lalu *biar kedengeran kaya lagi dongeng* ada orang yang bertanya tentang suatu algoritma yang bisa mendeteksi kemiripan dari dokumen atau lebih dikenal dengan dokumen similaritas, dalam hati sebenernya jujur saya belum pernah denger algoritma apa yang cocok buat itu *maklum waktu jadi mahasiswa jarang banget gaul ke perpustakaan* tapi karna keingintahuan dan ke-soktahuan yang tinggi *untung waktu itu nannya-nya lewat BBM jadi bisa searching dulu* akhirnya ketemu lah suatu algoritma yang disebut bisa mendeteksi atau memeriksa kemiripan sebuah objek (dalam hal ini bisa string kata, dan dokumen) , dan karena pengen ngoprek algoritma ini akhirnya nyemplung lah untuk ngoprek algoritma ini dari model yang sederhana aja (string kata), kita akan memulai dari yang kecil dulu (huruf -> kata -> kalimat -> paragraf -> dokumen).

Sebelum kita mulai membahas algoritma ini, kita harus kenalan dulu sama algoritma levenshtein karena ada pepatah mengatakan “tak kenal maka tak sayang” :p. Continue reading “Algoritma Levenshtein”