Etiket derlemtr

AI, Dağarcık, derlem, DerlemTR, kod, leksikon, python, Türkçe, yapay zeka

DerlemTR (11) Zemberek Hangi Kelimeleri Çözemiyor?

DerlemTR çalışmaları yoğunlaştıkça, Zemberek tarafından analizi yapılamayan bazı kelimeler de ortaya çıkmaya başladı.Java konusunda uzman olmadığım için github’daki Zemberek projesini klonlayıp koda müdahale edebilmem mümkün değil. Ancak kaynak sözcüklere eklemeler yaparak bu eksik kelimeleri de analiz edilebilen kelimelere katmak mümkün…

admin
2026-01-03

AI, Dağarcık, derlem, DerlemTR, kod, leksikon, python, Türkçe

DerlemTR (10) TRMorph Kullanmaktan Niçin Vazgeçtim?

Geçtiğimiz hafta, veritabanımızdaki “kelimeler” tablosunu zenginleştirebilmek için yeni adımlar attım. Bunlardan biri de TRMorph kullanımıyla ilgiliydi. Ne yazık ki, yaptığım yoğun testler sonucunda, özellikle çok sık karşılaşılmayan veya hatalı sözcükler sözkonusu olduğunda, bu araç istenmeyen sonuçlar üretiyor. Özellikle kelime zenginleştirme…

admin
2025-12-28

AI, akta, Dağarcık, derlem, DerlemTR, kod, python, Türkçe, yapay zeka

Olmak mı? Olmamak mı?

“Ol” fiil kökünden türeyen kelime sayısını bir aydan kısa bir süre önce yazdığım bir yazıda 1410 olarak belirtmiştim. Olmak Fiil Kökünden Kaç Geçerli Türkçe Sözcük Türetilebilir? Üstelik bunun bir rekor olduğunu söylemiştim. Çünkü o günlerde, bu sayılar benim için gerçekten…

admin
2025-12-13

AI, Dağarcık, derlem, DerlemTR, kod, python, Türkçe

DerlemTR (08) Zemberek ve TRmorph ile Türkçe Kelime Analizleri

DerlemTR Projesi kapsamında toparladığım kelimeleri önce Zemberek aracılığıyla analiz ettim. Ancak bazı sözcükleri Zemberek analiz edemedi.Önümde iki seçenek vardı: Zemberek projesi java diliyle geliştirildiği için, kodlama konusunda yapabileceğim pek bir şey yok. Java’yı bilirim ama, hakim değilim. Kodları gerektiğinde yorumlayabilirim…

admin
2025-11-28

AI, Dağarcık, derlem, DerlemTR, kod, python, Türkçe, yapay zeka

DerlemTR (07) ÇEKOSLOVAKYALILAŞTIRAMADIKLARIMIZDANMIŞÇASINA

Benim çocukluğımda, yani 60 yıl öncesinde, en uzun Türkçe kelime “Çekoslovakyalılaştıramadıklarımızdanmısınız” şeklindeydi. Oysa bu, yanlış bir kelimeydi. Çünkü soru ekleri Türkçede ayrı yazılır. Zemberek’in kelime dağarcığımızdan yakalayabildiği ve kurallara uygun en uzun sözcük “çekoslovakyalılaştırmadıklarımızdanmışçasına”. Tam 45 harf içeriyor. İkinci sıradakinden…

admin
2025-11-26

AI, Dağarcık, derlem, DerlemTR, python, Türkçe, yapay zeka

DerlemTR (06) Türkçe Kelimelerin Tiplerine göre Gruplanması

Zemberek kategorizasyonuna göre ayrıntılı tip sayısı 32 idi. Bu tipleri sadece ana tipler altında birleştirirsek, elimizde sadece 11 ana tip kalıyor: Noun (isim), Verb (fiil), Adj (sıfat), Num (sayı), Pron (zamir), Adv (zarf), Postp (edat), Interj (ünlem), Ques (soru), Conj…

admin
2025-11-25

AI, Dağarcık, derlem, DerlemTR, kod, python, Türkçe, yapay zeka

DerlemTR (05) Türkçenin İstatistikleri

Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000 kelime ve Zemberek çözümlemelerine dayandığını peşinen belirteyim. İlk tablomuz, Türkçe sözcüklerin tiplerine göre nasıl gruplandığını gösteriyor. Toplam kolonundaki sayılar o…

admin
2025-11-24

AI, akta, derlem, DerlemTR, kod, python, Türkçe, yapay zeka

DerlemTR (04) AKTA Projesinden 10GB – 30 Bin Dosyalık Türkçe Kaynak

DerlemTR projesi 10 yıl önceye dayanıyor. Bu projenin amacı da yeni projemizle aynı. O yüzden yeni projeyi DerlemTR projesiyle birleştirmeye karar verdim. Projenin tüm eski kayıtlarını, eski-versiyon isimli bir klasöre kopyaladım. Yani, isteyen olursa, eski kayıtlara da kolayca ulaşabilir. AKTA…

admin
2025-11-22