Kategori yapay zeka

DerlemTR (11) Zemberek Hangi Kelimeleri Çözemiyor?

DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.Java konusunda uzman olmadığım için github’daki Zemberek projesini klonlayıp koda müdahale edebilmem mümkün değil. Ancak kaynak sözcüklere eklemeler yaparak bu eksik kelimeleri de analiz edilebilen kelimelere katmak mümkün…

Olmak mı? Olmamak mı?

“Ol” fiil kökünden türeyen kelime sayısını bir aydan kısa bir süre önce yazdığım bir yazıda 1410 olarak belirtmiştim. Olmak Fiil Kökünden Kaç Geçerli Türkçe Sözcük Türetilebilir? Üstelik bunun bir rekor olduğunu söylemiştim. Çünkü o günlerde, bu sayılar benim için gerçekten…

DerlemTR (07) ÇEKOSLOVAKYALILAŞTIRAMADIKLARIMIZDANMIŞÇASINA

Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri Türkçede ayrı yazılır. Zemberek’in kelime dağarcığımızdan yakalayabildiği ve kurallara uygun en uzun sözcük “çekoslovakyalılaştırmadıklarımızdanmışçasına”. Tam 45 harf içeriyor. İkinci sıradakinden…

DerlemTR (05) Türkçenin İstatistikleri

Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000 kelime ve Zemberek çözümlemelerine dayandığını peşinen belirteyim. İlk tablomuz, Türkçe sözcüklerin tiplerine göre nasıl gruplandığını gösteriyor. Toplam kolonundaki sayılar o…