Yeni Bir Python Derleyici ve Çok Daha Fazlası – MOJO

Post Views: 336 Bir süredir yeni yazı yazmaya fırsat bulamıyordum. Çünkü yepyeni bir konuyu araştırıyordum: Mojo. Mojo, derlenen bir dil. Rust ve Python gibi dillerden esinlenerek geliştiriliyor. Python ile çok uyumlu. Mojo içinden Python’a erişip, neredeyse herşeyi yaptırabiliyorsunuz. Tersi de…

DerlemTR (11) Zemberek Hangi Kelimeleri Çözemiyor?

Post Views: 473 DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.Java konusunda uzman olmadığım için github’daki Zemberek projesini klonlayıp koda müdahale edebilmem mümkün değil. Ancak kaynak sözcüklere eklemeler yaparak bu eksik kelimeleri de analiz edilebilen…

DerlemTR (10) TRMorph Kullanmaktan Niçin Vazgeçtim?

Post Views: 485 Geçtiğimiz hafta, veritabanımızdaki “kelimeler” tablosunu zenginleştirebilmek için yeni adımlar attım. Bunlardan biri de TRMorph kullanımıyla ilgiliydi. Ne yazık ki, yaptığım yoğun testler sonucunda, özellikle çok sık karşılaşılmayan veya hatalı sözcükler sözkonusu olduğunda, bu araç istenmeyen sonuçlar üretiyor.…

Türkçe Verisetleri

Post Views: 583 Ne yazık ki dilimize özgü açık verisetlerine ulaşmak hiç de kolay olmuyor. Derlemtr projesi kapsamında yaptığım çalışmalarda, bu tür verisetlerine çok ihtiyaç duyuyorum. Eminim ki bu sıkıntıyı yaşayan başkaları da vardır. Bu yüzden, ulaşabildiğim ve erişime açık…

DerlemTR (07) ÇEKOSLOVAKYALILAŞTIRAMADIKLARIMIZDANMIŞÇASINA

Post Views: 507 Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri Türkçede ayrı yazılır. Zemberek’in kelime dağarcığımızdan yakalayabildiği ve kurallara uygun en uzun sözcük “çekoslovakyalılaştırmadıklarımızdanmışçasına”. Tam 45 harf…

DerlemTR (05) Türkçenin İstatistikleri

Post Views: 493 Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000 kelime ve Zemberek çözümlemelerine dayandığını peşinen belirteyim. İlk tablomuz, Türkçe sözcüklerin tiplerine göre nasıl gruplandığını gösteriyor. Toplam…