Ne yazık ki dilimize özgü açık verisetlerine ulaşmak hiç de kolay olmuyor.
Derlemtr projesi kapsamında yaptığım çalışmalarda, bu tür verisetlerine çok ihtiyaç duyuyorum.
Eminim ki bu sıkıntıyı yaşayan başkaları da vardır.
Bu yüzden, ulaşabildiğim ve erişime açık Türkçe kaynakları paylaşmaya karar verdim.
Yeni kaynaklara ulaştıkça bu listeyi de genişleteceğim.
Kırık linklere veya yeni kaynaklara rastladığınızda beni bilgilendirirseniz sevinirim.
Ahmet Aksoy
| Github AKTA Projesi | Project Gutenberg projesiyle paylaşılan kaynakların Türkçe çevirileri (Kullanmadan önce header ve footer bölümlerinin temizlenmesi gerekir. (28,837 dosya/ 10.1GB) |
| https://www.denizyuret.com/2006/11/turkish-resources.html | Çeşitli kaynaklar listeleniyor |
| https://data.tdd.ai/ | Turkish Data Depository |
| http://tools.nlp.itu.edu.tr/Datasets | Çeşitli kaynaklar |
| https://github.com/selimfirat/bilkent-turkish-writings-dataset | Bilkent Turkish Writings Dataset |
| https://data.ibb.gov.tr/ | İBB Açık Veri Portalı |
| https://www.gencbeyinler.net/projelerinize-uygun-veri-setlerini-bulacaginiz-web-siteleri/ | Çeşitli kaynak siteleri |
| https://evam.tuik.gov.tr/datasets | Türkiye İstatistik Kurumu verisetleri |