Hürriyet Gazetesinde Yıllara Göre Sözcük Kullanımı
Hürriyet Gazetesi arşivlerini yıllara göre tarama çalışmamız devam ediyor. 2010 ve 2011 yıllarına ait taramalar tamamlandı. (2012, 2013, 2014 ve 2015 te tamam.)
Aşağıda, elde ettiğimiz sözcük frekans listelerinin başında yer alan sözcükleri karşılaştıran bir tablomuz var. Gördüğünüz gibi listeler neredeyse birbirlerinin aynısı. Sadece küçük yer değiştirmeler mevcut. İlk 12 sözcük tamamen birbirinin eşi.
Ancak listeyi uzatırsak, daha alt bölgelerdeki değişimlerin giderek daha büyük boyutlara ulaştığını görürüz. Çünkü aşağılara indikçe, sözcükler arasındaki frekans farklılıkları küçülmekte; bu da kaymaların giderek daha fazla basamağı kapsama olasılığını arttırmaktadır.
Diğer yıllara ait sonuçları da taramalar bittikçe tabloya ekleyeceğim.
Henüz gerçekleştirmediğim bir çalışmada bazı kişi, yer ve kurum isimlerinin kullanım sıklığının yıllara göre değişimini saptamayı planlıyorum. Böyle bir rapor kişi, yer ve kurumların günlük haberler açısından popülerliğinin nasıl değiştiğini gösterecektir. İlginç sonuçlar çıkacağını umuyorum.
Evet, 2013 yılının sonuçlarını da listeye ekledim. Hala, ilk 11 sözcüğün sıralaması aynı.
2014 ve yılına ait veriler de sıralamanın ilk 11 sıralamasını değiştirmedi.
Hürriyet Gazetesinde Yıllara Göre En sık kullanılan ilk 30 sözcük | |||||||
2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | |
01 | ve | ve | ve | ve | ve | ve | |
02 | bir | bir | bir | bir | bir | bir | |
03 | bu | bu | bu | bu | bu | bu | |
04 | da | da | da | da | da | da | |
05 | de | de | de | de | de | de | |
06 | için | için | için | için | için | için | |
07 | ile | ile | ile | ile | ile | ile | |
08 | çok | çok | çok | çok | çok | çok | |
09 | olarak | olarak | olarak | olarak | olarak | olarak | |
10 | daha | daha | daha | daha | daha | daha | |
11 | en | en | en | en | en | en | |
12 | olan | olan | olan | türkiye | olan | ise | |
13 | türkiye | ise | türkiye | ise | ise | olan | |
14 | ise | türkiye | ise | olan | türkiye | türkiye | |
15 | dedi | dedi | dedi | sonra | sonra | sonra | |
16 | sonra | sonra | ilk | dedi | kadar | kadar | |
17 | olduğunu | ilk | sonra | ilk | her | dedi | |
18 | kadar | olduğunu | kadar | kadar | gibi | her | |
19 | ilk | kadar | olduğunu | olduğunu | dedi | gibi | |
20 | büyük | büyük | büyük | her | ilk | var | |
21 | gibi | bin | her | gibi | bin | ilk | |
22 | bin | gibi | gibi | var | var | bin | |
23 | başkanı | her | var | bin | ne | olduğunu | |
24 | söyledi | başkanı | başkanı | büyük | o | büyük | |
25 | nin | söyledi | bin | son | yeni | ne | |
26 | her | yeni | son | yıl | büyük | yeni | |
27 | yıl | son | yeni | ama | olduğunu | başkanı | |
28 | yeni | yüzde | yıl | başkanı | son | ama | |
29 | ın | var | nin | yeni | ama | o | |
30 | var | yıl | söyledi | o | ilgili | yıl |
Ahmet Aksoy
DerlemTR Proje Yöneticisi
Keşke tarama sırasında bağlaç vb. çok sık kullanılan kelimeleri ayıklayıp öyle tarama yapsaydınız. “ve” bağlacının çok kullanılması bir anlam ifade etmiyor. Bunun yerine daha özel kelimeler tespit edilebilirdi bence.
Merhaba Ender bey,
Derlem dosyaları herşeyi kapsar. Kapsamalıdır. “Stop word” denilen bu tür sözcükler de bir dilin temel ögelerindendir. Eğer bu tür sözcükleri içermeyen bir liste isterseniz, onları sildiğinizde istediğiniz listeye kavuşursunuz. Ama baştan listeye dahil etmezseniz, yaptığınız çalışmayı aksatmış olursunuz.