admin

admin

Yeni Bir Python Derleyici ve Çok Daha Fazlası – MOJO

Bir süredir yeni yazı yazmaya fırsat bulamıyordum. Çünkü yepyeni bir konuyu araştırıyordum: Mojo. Mojo, derlenen bir dil. Rust ve Python gibi dillerden esinlenerek geliştiriliyor. Python ile çok uyumlu. Mojo içinden Python’a erişip, neredeyse herşeyi yaptırabiliyorsunuz. Tersi de geçerli. Yani Python…

DerlemTR (11) Zemberek Hangi Kelimeleri Çözemiyor?

DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.Java konusunda uzman olmadığım için github’daki Zemberek projesini klonlayıp koda müdahale edebilmem mümkün değil. Ancak kaynak sözcüklere eklemeler yaparak bu eksik kelimeleri de analiz edilebilen kelimelere katmak mümkün…

DerlemTR (10) TRMorph Kullanmaktan Niçin Vazgeçtim?

Geçtiğimiz hafta, veritabanımızdaki “kelimeler” tablosunu zenginleştirebilmek için yeni adımlar attım. Bunlardan biri de TRMorph kullanımıyla ilgiliydi. Ne yazık ki, yaptığım yoğun testler sonucunda, özellikle çok sık karşılaşılmayan veya hatalı sözcükler sözkonusu olduğunda, bu araç istenmeyen sonuçlar üretiyor. Özellikle kelime zenginleştirme…

Türkçe Verisetleri

Ne yazık ki dilimize özgü açık verisetlerine ulaşmak hiç de kolay olmuyor. Derlemtr projesi kapsamında yaptığım çalışmalarda, bu tür verisetlerine çok ihtiyaç duyuyorum. Eminim ki bu sıkıntıyı yaşayan başkaları da vardır. Bu yüzden, ulaşabildiğim ve erişime açık Türkçe kaynakları paylaşmaya…

Olmak mı? Olmamak mı?

“Ol” fiil kökünden türeyen kelime sayısını bir aydan kısa bir süre önce yazdığım bir yazıda 1410 olarak belirtmiştim. Olmak Fiil Kökünden Kaç Geçerli Türkçe Sözcük Türetilebilir? Üstelik bunun bir rekor olduğunu söylemiştim. Çünkü o günlerde, bu sayılar benim için gerçekten…

DerlemTR (08) Zemberek ve TRmorph ile Türkçe Kelime Analizleri

DerlemTR Projesi kapsamında toparladığım kelimeleri önce Zemberek aracılığıyla analiz ettim. Ancak bazı sözcükleri Zemberek analiz edemedi.Önümde iki seçenek vardı: Zemberek projesi java diliyle geliştirildiği için, kodlama konusunda yapabileceğim pek bir şey yok. Java’yı bilirim ama, hakim değilim. Kodları gerektiğinde yorumlayabilirim…

DerlemTR (07) ÇEKOSLOVAKYALILAŞTIRAMADIKLARIMIZDANMIŞÇASINA

Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri Türkçede ayrı yazılır. Zemberek’in kelime dağarcığımızdan yakalayabildiği ve kurallara uygun en uzun sözcük “çekoslovakyalılaştırmadıklarımızdanmışçasına”. Tam 45 harf içeriyor. İkinci sıradakinden…