Zemberek kategorizasyonuna göre ayrıntılı tip sayısı 32 idi. Bu tipleri sadece ana tipler altında birleştirirsek, elimizde sadece 11 ana tip kalıyor: Noun (isim), Verb (fiil), Adj (sıfat), Num (sayı), Pron (zamir), Adv (zarf), Postp (edat), Interj (ünlem), Ques (soru), Conj (bağlaç), Det (belirteç).
Bu şekilde grupladığımızda isim tipine dahil kelime sayısı, fiillerin üzerine çıkıyor.
| TOPLAM | 2,712,064 | 100.000 |
| Noun – isim | 1,244,867 | 45.901 |
| Verb – fiil | 1,187,964 | 43.803 |
| Adj – sıfat | 270,027 | 9.957 |
| Num – sayı | 4858 | 0.179 |
| Pron – zamir | 2598 | 0.096 |
| Adv – zarf | 939 | 0.035 |
| Postp – edat | 470 | 0.017 |
| Interj – ünlem | 215 | 0.008 |
| Ques – soru | 79 | 0.003 |
| Conj – bağlaç | 41 | 0.002 |
| Det – belirteç | 6 | 0.000 |
Aşağıdaki pasta grafiğinden de göreceğiniz gibi, isim, fiil ve sıfat tipi kelimelerin oranı %99.65 düzeyinde. Diğer 8 tipe dahil olan kelimelerin payı ise sadece % 0.35.

Bütün bu sayılar gösteriyor ki, Türkçe, isim, fiil ve sıfat tipi kelimelerden oluşmuş bir çatıya sahip.
İngilizce için Google Gemini’ye yaptırdığım araştırmanın sonuçları şu şekilde:
| Ana Kategori | Tahmini Yüzde Aralığı | Notlar |
| Noun | %25 – %35 | Metinde en yüksek frekansa sahip açık sınıflı kelime türüdür. |
| Verb | %15 – %25 | İsimlerden sonra en sık kullanılan açık sınıflı kelime türüdür. |
| Determiner | %10 – %15 | “the” ve “a/an” gibi kelimeler çok sık kullanıldığı için yüzdesi yüksektir. |
| Preposition | %10 – %15 | “of”, “in”, “to” gibi kelimeler çok sık geçer. |
| Adjective | %5 – %10 | |
| Pronoun | %3 – %7 | “I”, “you”, “he” gibi kelimeler sıklıkla kullanılır. |
| Adverb | %3 – %5 | |
| Conjunction | %2 – %4 | “and”, “but” gibi kelimeler dâhildir. |
Buradaki sayılar, İngilizce kelime yapısının Türkçeye kıyasla daha homojen bir tip dağılımına sahip olduğunu gösteriyor.
Bir sonraki yazımda, en uzun 20 Türkçe kelimeyi ele alacağım.
Ahmet Aksoy
Not: Verdiğim sayılar, DerlemTR projesi kapsamında derlediğim kelime dağarcığına dayanmaktadır. Bunlar, mutlak sayılar değildir. Sürekli değişmektedir. Yine de bu sayıların gerçeğe oldukça yakın olduğunu söyleyebilirim. Çünkü bu derlemelerde çok farklı kaynaklardan yararlanılmıştır.