Bu yazımda, benim de yeni farkına vardığım, Türkçeye ait bazı sayısal değerleri ele alacağım.
Elde ettiğim sayıların mutlak olmadığını, veritabanımdaki 2,745,000 kelime ve Zemberek çözümlemelerine dayandığını peşinen belirteyim.
İlk tablomuz, Türkçe sözcüklerin tiplerine göre nasıl gruplandığını gösteriyor. Toplam kolonundaki sayılar o tipe ait kelime sayısını veriyor. tip kolonundaki bilgiler, Zemberek tarafından saptanmıştır. Açıklama kolonunda ise tiplerin Türkçe karşılıklarını vermeye çalıştım. Bazı belirsizlikler var ama, onları da yakında çözeriz.
KELİME TİPLERİNE GÖRE GRUPLANMIŞ KELİMELER
| toplam | detay(örnek) | tip | açıklama |
| 1187964 | abanmak | Verb | Fiil |
| 1001043 | aba | Noun | İsim |
| 268889 | aba | Adj | Sıfat |
| 229257 | Aachen | Noun,Prop | Özel isim |
| 8627 | Aa | Noun,Abbrv | İsim kısaltma |
| 5940 | akşam | Noun,Time | İsim – zaman |
| 3415 | altmış | Num,Card | Sayma sayıları |
| 1175 | altmışıncı | Num,Ord | Sıra sayıları |
| 1138 | Acemce | Adj,Prop | Özel sıfat |
| 929 | acaba | Adv | Zarf |
| 921 | ben | Pron,Pers | Kişi zamiri |
| 735 | bazı | Pron,Quant | Sayı zamiri |
| 497 | hangi | Pron,Ques | Soru zamiri |
| 291 | kendi | Pron,Reflex | Yansımalı zamir |
| 212 | abur | Dup | ? |
| 211 | abe | Interj | Ünlem |
| 207 | altmışar | Num,Dist | Sıfat tamlaması ? |
| 155 | ait | Postp,PCDat | Edat |
| 154 | bu | Pron,Demons | İşaret edatı |
| 116 | beri | Postp,PCAbl | Edat? |
| 96 | boyunca | Postp,PCNom | Edat? |
| 79 | mi | Ques | Soru |
| 61 | beşyüz | Num | Sayısal |
| 55 | gibi | Postp,PCGen | Edat? |
| 41 | belki | Conj | Bağlaç |
| 33 | birlikte | Postp,PCIns | Edat? |
| 14 | aşkın | Postp,PCAcc | Edat? |
| 8 | bahar | Adv,Time | Zaman zarfı |
| 6 | aha | Det | Belirteç |
| 4 | Hm | Interj,Prop | Özel ünlem |
| 2 | Osmanlıca | Adv,Prop | Özel zarf |
| 1 | iştiraken | Postp | Edat |
Tabloya göre Türkçe’de kullandığımız kelimelerin çoğunluğu fiil (eylem) kökenlidir. İsim kökenliler onu izlemekte, üçüncü sırayı ise sıfat kökenli sözcükler almaktadır.
Burada bir açıklama daha yapayım: listemizdeki sözcükler hem türetilmiş kelimelerden, hem de çekim ekleri ulanmış kelimelerden oluşmaktadır. Coğrafik yer adları, kişi adları ve kısmen yabancı kökenli kelimeler de bu listeye dahildir.
Bir sonraki tablomuz oldukça büyük. Listemizdeki kelimelerin kök ve tiplerine göre gruplanmış halini gösteriyor. Toplamda 58565 satır, yani kök var. Tabloya bunlardan sadece bazılarını ekleyeceğim.
KÖK VE TİPLERE GÖRE GRUPLANMIŞ KELİMELER (KISMİ TABLO)
| Sayı | Kök | Tip |
| 6163 | etmek | Verb |
| 4954 | yapmak | Verb |
| 4034 | olmak | Verb |
| 3638 | yaşamak | Verb |
| 3529 | tanımak | Verb |
| 3471 | vermek | Verb |
| 3429 | kullanmak | Verb |
| … | … | … |
| 2403 | ödemek | Verb |
| 2401 | gerçek | Adj |
| 2400 | öldürmek | Verb |
| … | … | … |
| 2161 | göndermek | Verb |
| 2159 | karşı | Adj |
| 2154 | yemek | Verb |
| ,,, | ,,, | ,,, |
| 1322 | atlamak | Verb |
| 1322 | sınıf | Noun |
| 1321 | seyretmek | Verb |
| … | … | … |
Gördüğünüz gibi rekor etmek fiilinde. Bu kökten tan 6163 kelime türeyebiliyor.
Bu yazıda örnekleri paylaşmayacağım. Ama bir ara bu kelimeleri de örneklemek yerinde olur.
Bu görsel de en üretken kökleri wordcloud aracılığıyla görselleştiriyor.

Ara ara başka istatistikleri de paylaşacağm.
Merak ettiğiniz başka sayılar varsa, yorum alanından paylaşın. Çözümlemeye çalışırım.
Bütün bu rakamlar aslında Türkçemizin ne kadar sistematik ve zengin bir dil olduğunu gösteriyor.
Atalarımız, her somut nesne ve soyut kavram ya da eylem için yeni bir sözcük yaratmak yerine, var olanların nüanslarıyla dilimizi olağanüstü zenginleştirmişler. Üstelik bunları da görünmez kurallara bağlamışlar.
Bakalım daha ne gibi kurallar ve incelikler keşfedeceğiz?
Ahmet Aksoy