Kategori akta

Türkçe Verisetleri

Ne yazık ki dilimize özgü açık verisetlerine ulaşmak hiç de kolay olmuyor. Derlemtr projesi kapsamında yaptığım çalışmalarda, bu tür verisetlerine çok ihtiyaç duyuyorum. Eminim ki bu sıkıntıyı yaşayan başkaları da vardır. Bu yüzden, ulaşabildiğim ve erişime açık Türkçe kaynakları paylaşmaya…

Olmak mı? Olmamak mı?

“Ol” fiil kökünden türeyen kelime sayısını bir aydan kısa bir süre önce yazdığım bir yazıda 1410 olarak belirtmiştim. Olmak Fiil Kökünden Kaç Geçerli Türkçe Sözcük Türetilebilir? Üstelik bunun bir rekor olduğunu söylemiştim. Çünkü o günlerde, bu sayılar benim için gerçekten…

Türkçe Belge Sınıflandırma Projesi

AKTA projesine katkıda bulunmak üzere Türkçe Belge Sınıflandırması yapmam gerekiyor. Gutenberg Projesi‘nin arşivindeki belgeler için bir sınıflandırma yapılmamış. Oysa bu belgeleri belirli kategoriler altında toplamak, LLM veya benzeri çalışmalarda Türkçe belgelerin kullanımı açısından yarar sağlayabilir. Bu aralar kod çalışması yaparken…

AKTA – AÇIK KAYNAK TÜRKÇE BELGE ARŞİVİ (1)

AKTA projesini github üzerinden paylaşıyorum. Github reposunu olur-olmaz güncellemek yerine, bazı gelişmeleri gurmezin.com üzerinden yapmak çok daha kolay olacak. Project Gutenberg üzerinden belge indirip Türkçeleştirme çalışmalarına başladım. Şu anki hızımla günde 100 kadar dosyayı Türkçeleştirebilirim. Bu sayıyı arttırmak, bazı riskleri…