DerlemTR (10) TRMorph Kullanmaktan Niçin Vazgeçtim?

Geçtiğimiz hafta, veritabanımızdaki “kelimeler” tablosunu zenginleştirebilmek için yeni adımlar attım. Bunlardan biri de TRMorph kullanımıyla ilgiliydi.

Ne yazık ki, yaptığım yoğun testler sonucunda, özellikle çok sık karşılaşılmayan veya hatalı sözcükler sözkonusu olduğunda, bu araç istenmeyen sonuçlar üretiyor.

Özellikle kelime zenginleştirme aşamasında, “TRMorph” kullanımı, mevcut verilerin kirlenmesine neden oluyor.

Bu yüzden, “TRMorph” kullanımını iptal ettim.

Bu araç, yine proje betikleri arasında yer almaya devam edecek. Ancak, kullanacakların çok dikkatli olması gerekiyor.

Zemberek‘in analiz edemediği kelimeler de çıkıyor elbette. Ama, oldukça sınırlı. Onları başka bir yazıda ele alacağım.

Zemberekle ilgili en büyük sorunum, tanımadığı ama analize uygun sözcükleri, yanlış bile olsalar, “Noun” – “İsim” varsayması.

Herşeye rağmen, DerlemTR projesi hızla ilerliyor.

Ahmet Aksoy

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Scroll to Top