DerlemTR (08) Zemberek ve TRmorph ile Türkçe Kelime Analizleri
DerlemTR Projesi kapsamında toparladığım kelimeleri önce Zemberek aracılığıyla analiz ettim. Ancak bazı sözcükleri Zemberek analiz edemedi.Önümde iki seçenek vardı: Zemberek […]
Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri
Zemberek kategorizasyonuna göre ayrıntılı tip sayısı 32 idi. Bu tipleri sadece ana tipler altında birleştirirsek, elimizde sadece 11 ana tip
Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000
DerlemTR projesi 10 yıl önceye dayanıyor. Bu projenin amacı da yeni projemizle aynı. O yüzden yeni projeyi DerlemTR projesiyle birleştirmeye
Buradaki yazılarımda bundan sonra proje adını sadece “DerlemTR” olarak kullanacağım. Github üzerindeki projede kodlarla ilgili veya diğer açıklamaları uzun uzadıya
Yaptığım araştırmaların ve kodlama çalışmalarının sonucunda “olmak” fiilinden türeyen sözcük sayısı, benzerlerinden oldukça fazla: 1410 adet. Analizlere devam ettikçe, belki
TDK kaynaklarına göre “kadarki” sözcüğü geçerli bir sözcük değil.İnternetteki bazı kaynaklar ise buradaki ki ekinin ayrı yazılması gerektiğini belirtiyor. Oysa,