Türkçe Verisetleri

Ne yazık ki dilimize özgü açık verisetlerine ulaşmak hiç de kolay olmuyor.

Derlemtr projesi kapsamında yaptığım çalışmalarda, bu tür verisetlerine çok ihtiyaç duyuyorum.

Eminim ki bu sıkıntıyı yaşayan başkaları da vardır.

Bu yüzden, ulaşabildiğim ve erişime açık Türkçe kaynakları paylaşmaya karar verdim.

Yeni kaynaklara ulaştıkça bu listeyi de genişleteceğim.

Kırık linklere veya yeni kaynaklara rastladığınızda beni bilgilendirirseniz sevinirim.

Ahmet Aksoy

Github AKTA ProjesiProject Gutenberg projesiyle paylaşılan kaynakların Türkçe çevirileri (Kullanmadan önce header ve footer bölümlerinin temizlenmesi gerekir. (28,837 dosya/ 10.1GB)
https://www.denizyuret.com/2006/11/turkish-resources.htmlÇeşitli kaynaklar listeleniyor
https://data.tdd.ai/Turkish Data Depository
http://tools.nlp.itu.edu.tr/DatasetsÇeşitli kaynaklar
https://github.com/selimfirat/bilkent-turkish-writings-datasetBilkent Turkish Writings Dataset
https://data.ibb.gov.tr/İBB Açık Veri Portalı
https://www.gencbeyinler.net/projelerinize-uygun-veri-setlerini-bulacaginiz-web-siteleri/Çeşitli kaynak siteleri
https://evam.tuik.gov.tr/datasetsTürkiye İstatistik Kurumu verisetleri

Yorum bırakın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Scroll to Top