Java – Jaro Winkler algoritması ile String karşılaştırma

Merhabalar,

Bir text mining konusu ile karşınızdayım. Kardeşim, iki kelimeyi karşılaştırıp benzerlik oranını yüzde olarak ifade edebilecek bir program yazmamı istemişti. Kısa bir araştırma sonrası  bu konu ile ilgili bir çok araştırma ve makaleye rastladım. Bugünkü blog yazımda bu araştırmalardan biri olan Jaro-winkler algoritmasından bahsedeceğim. tabiki arkasındaki çalışan matemetik algoritmasından değilde daha çok programınıza nasıl yerleştireceğinizden bahsedeceğim.

https://github.com/tdebatty/java-string-similarity

yukarıda verdiğim github adresinden tüm karşılaştırma sınıflarını indirebilirsiniz. indirdiğiniz dosyayı herhangi bir sıkıştırma programı ile açıp ecilipse’ın src klasörünün altına info.debatty.java.stringsimilarity şeklinde klasör oluşturun. Jaro-Winkler ile ilgili dosyaları bu klasörün altına koyun.

basit bir main sınıfı koyarak aşağıdaki gibi bir test simülasyonu yapabilirsiniz.

http://www.gokhansaman.com/wp-content/plugins/sociofluid/images/google_48.png http://www.gokhansaman.com/wp-content/plugins/sociofluid/images/myspace_48.png http://www.gokhansaman.com/wp-content/plugins/sociofluid/images/facebook_48.png http://www.gokhansaman.com/wp-content/plugins/sociofluid/images/yahoobuzz_48.png http://www.gokhansaman.com/wp-content/plugins/sociofluid/images/twitter_48.png

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir