DerlemTR (08) Zemberek ve TRmorph ile Türkçe Kelime Analizleri
DerlemTR Projesi kapsamında toparladığım kelimeleri önce Zemberek aracılığıyla analiz ettim. Ancak bazı sözcükleri Zemberek analiz edemedi.Önümde iki seçenek vardı: Zemberek […]
Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri
Zemberek kategorizasyonuna göre ayrıntılı tip sayısı 32 idi. Bu tipleri sadece ana tipler altında birleştirirsek, elimizde sadece 11 ana tip
Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000
DerlemTR projesi 10 yıl önceye dayanıyor. Bu projenin amacı da yeni projemizle aynı. O yüzden yeni projeyi DerlemTR projesiyle birleştirmeye
Buradaki yazılarımda bundan sonra proje adını sadece “DerlemTR” olarak kullanacağım. Github üzerindeki projede kodlarla ilgili veya diğer açıklamaları uzun uzadıya
Aslına bakarsanız bu proje üzerinde 10 yıldan uzun bir süredir çalışıyorum. Elbette arada uzun boşluklar da oldu. Şimdi bu projenin
Yaptığım araştırmaların ve kodlama çalışmalarının sonucunda “olmak” fiilinden türeyen sözcük sayısı, benzerlerinden oldukça fazla: 1410 adet. Analizlere devam ettikçe, belki