DerlemTR (11) Zemberek Hangi Kelimeleri Çözemiyor?
DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.Java konusunda uzman olmadığım için github’daki Zemberek projesini […]
DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.Java konusunda uzman olmadığım için github’daki Zemberek projesini […]
Ne yazık ki dilimize özgü açık verisetlerine ulaşmak hiç de kolay olmuyor. Derlemtr projesi kapsamında yaptığım çalışmalarda, bu tür verisetlerine
“Ol” fiil kökünden türeyen kelime sayısını bir aydan kısa bir süre önce yazdığım bir yazıda 1410 olarak belirtmiştim. Olmak Fiil
Bir hafta kadar önce, elimdeki kaynaklara göre, Türkçe’nin ayrık kelime sayısı 4 milyondan biraz fazlaydı. Veritabanıma işlenmemiş bazı sözcükler olduğundan
Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri
Zemberek kategorizasyonuna göre ayrıntılı tip sayısı 32 idi. Bu tipleri sadece ana tipler altında birleştirirsek, elimizde sadece 11 ana tip
Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000