Yapay Zeka - Bilim - Teknoloji (AI-Sci-Tech)
Yapay Zeka - Bilim - Teknoloji (AI-Sci-Tech)
Kategori Türkçe
DerlemTR (03) WikiMedia Makalelerini İndirmek

DerlemTR projemizde kullanacağımız aday kelimeleri elde etmede Wikimedia çok önemli bir kaynak oldu. Bu kaynağı bir corpus olarak kullanmak için üzerinde biraz çalışmak gerekir. Ancak bize sadece kelimeler lazım olduğu için, yapacağımız şey, gereksiz karakterleri süzmekten ibaret olacak. Wikimedia en…
Yeniden Canlanan DerlemTR Github Projesi (02)
Buradaki yazılarımda bundan sonra proje adını sadece “DerlemTR” olarak kullanacağım. Github üzerindeki projede kodlarla ilgili veya diğer açıklamaları uzun uzadıya paylaşmak mümkün değil. O yüzden bu tür açıklamaları buradan paylaşacağım. Belki ileride projenin kendine özgü bir sitesini açmak mümkün olursa,…
Yeniden Canlanan DerlemTR Github Projesi (01)
Olmak Fiil Kökünden Kaç Geçerli Türkçe Sözcük Türetilebilir?
Yaptığım araştırmaların ve kodlama çalışmalarının sonucunda “olmak” fiilinden türeyen sözcük sayısı, benzerlerinden oldukça fazla: 1410 adet. Analizlere devam ettikçe, belki bu rekoru başka sözcükler alacak. Eğer ilgi duyarsanız ve yeterli zamanınız varsa, aşağıda vereceğim listeyi siz de inceleyebilirsiniz. Belki gözden…
TÜRKÇE SÖZCÜK DAĞARCIĞINDAKİ 2 MİLYON SÖZCÜĞÜN ÖYKÜSÜ
Birkaç aydır Türkçe sözcükleri temiz ve denetlenmiş bir liste halinde derleme çalışmaları yapıyorum. Bu çalışma, github üzerinden paylaştığım eski DerlemTR () projemin devamı niteliğinde. DerlemTR projesinde elde ettiğim ayrık sözcükleri, onların kullanım frekanslarını kullanarak kolaylıkla temizleyebileceğimi ummuştum. Fakat hiç de…