DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.
Java konusunda uzman olmadığım için github’daki Zemberek projesini klonlayıp koda müdahale edebilmem mümkün değil. Ancak kaynak sözcüklere eklemeler yaparak bu eksik kelimeleri de analiz edilebilen kelimelere katmak mümkün olabilir. Sanırım bunun için github zemberek projesine yeni bir “branch” açacağım.
Lafı fazla uzatmadan not aldığım analiz edilemeyen kelimelerin bir kısmını paylaşayım:
kendisininkinden
temizlikçi
umrumda (umurumda analiz edilebiliyor)
bloğu
huzme
adaçayı
vizyoner
emperyal
oğula (oğla analiz edilebiliyor)
ondalık
kanvas
komünyon
enkarnasyon
akıllıcaydı (akıllıca analiz edebiliyor)
teatral
kovalamacanın (kovalamaca analiz edebiliyor)
duymazdan
hipnotik
empatik
kanonik
eşitlikçi
erzağı (erzak analiz edebiliyor)
icraatları (icraat zaten çoğul olduğu için -lar eki alması engellenmiş olabilir)
vahyedilmiş (vahiy analiz edilebiliyor)
Bu kelimelerin çoğuna tesadüfen rastladım.
Bundan sonrası için daha sistematik bir tarama yapmayı düşünüyorum.
Ayrıca github zemberek projesine yeni bir dal açıp, kodlara dokunmadan, sadece kaynak dosyalarını zenginleştirerek yeni sürümler elde etmeyi düşünüyorum. Bu sürümler, derlemtr projesinin gelişmesine de katkıda bulunacaktır.
Ahmet Aksoy