Mar 102016
 
8.710 viewsTürkçe harf frekansları

Türkçe harf frekansları Türkçede En Çok Kullanılan 100 Sözcük başlıklı yazıda frekanslarına göre sözcükleri listelemiştim. Aynı dosya verilerini kullanarak bir de harfler için frekans analizi yaptım. Sözkonusu veri uzayında en fazla “a” karakteri kullanılmış. Bu karakter 253 milyon sözcük içeren 3700 belgede toplam 175 milyon 337 bin 451 kez tekrarlanmış. ‘Ğ’ harfinin kullanım frekansı ise aynı ortamda sadece 26,582. Belgelerde kullanılan harf sayısı ise kabaca […]