admin

admin

DerlemTR (08) Zemberek ve TRmorph ile Türkçe Kelime Analizleri

DerlemTR Projesi kapsamında toparladığım kelimeleri önce Zemberek aracılığıyla analiz ettim. Ancak bazı sözcükleri Zemberek analiz edemedi.Önümde iki seçenek vardı: Zemberek projesi java diliyle geliştirildiği için, kodlama konusunda yapabileceğim pek bir şey yok. Java’yı bilirim ama, hakim değilim. Kodları gerektiğinde yorumlayabilirim…

DerlemTR (07) ÇEKOSLOVAKYALILAŞTIRAMADIKLARIMIZDANMIŞÇASINA

Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri Türkçede ayrı yazılır. Zemberek’in kelime dağarcığımızdan yakalayabildiği ve kurallara uygun en uzun sözcük “çekoslovakyalılaştırmadıklarımızdanmışçasına”. Tam 45 harf içeriyor. İkinci sıradakinden…

DerlemTR (05) Türkçenin İstatistikleri

Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000 kelime ve Zemberek çözümlemelerine dayandığını peşinen belirteyim. İlk tablomuz, Türkçe sözcüklerin tiplerine göre nasıl gruplandığını gösteriyor. Toplam kolonundaki sayılar o…

Yeniden Canlanan DerlemTR Github Projesi (01)

Aslına bakarsanız bu proje üzerinde 10 yıldan uzun bir süredir çalışıyorum. Elbette arada uzun boşluklar da oldu. Şimdi bu projenin temel uygulama ögelerini github üzerinde yeni bir proje olarak paylaşıma açtım. (Daha doğrusu, 9 yıldır güncellenmeyen eski projemi yeniden kullanıma…