Aslına bakarsanız bu proje üzerinde 10 yıldan uzun bir süredir çalışıyorum.
Elbette arada uzun boşluklar da oldu.
Şimdi bu projenin temel uygulama ögelerini github üzerinde yeni bir proje olarak paylaşıma açtım. https://github.com/ahmetax/Checked-Turkish-Word-List
Amacım hazır bir liste vermek değil. İsteyenlerin, böyle bir listeyi yeni baştan ve belki de çok daha kapsamlı bir şekilde oluşturabilmesini sağlamak.
Pthon diline hakim olmak, proje detaylarını daha iyi kavramaya yardımcı olacaktır. Ama, uzmanlık gerekmiyor. Paylaştığım kodları doğrudan kopyala-yapıştır yöntemiyle çalıştırmak mümkün.
Kodların çoğunda Claude, Gemini ve Grok‘un katkılarından yararlandım.
İnternet bağlantılı kodlarda kullandığım mecburi bekletmeler, işlemlerin oldukça uzun sürmesini kaçınılmaz olarak beraberinde getiriyor. O yüzden, bu kodların çoğu, kapatılıp yeniden başlatmaya uygun olarak hazırlanmıştır.
Projede corpus olarak Wikimedia kaynaklarından yararlandım. Benim ulaşabildiğim en tutarlı açık kaynak burası oldu.
Denetleme sözlüğünü oluştururken TDK, Wiktionary ve Nişanyan‘dan yararlandım. Kelime analizlerinin temel ögesi ise Zemberek oldu.
Her türlü metni kullanarak da kelime dağarcığını genişletmeniz mümkün. Bunu sağlayacak araçlar, projede mevcut.
Eğer bu konu ilginizi çekiyorsa, projeye katkılarınızı da bekliyorum.
Ahmet Aksoy