Eki 152016
 
4.035 viewsHürriyet Data Örneği Kaggle Datasette

Hürriyet Data Örneği Kaggle Datasette Hürriyet Gazetesi haberlerinden türettiğim veri dosyalarından birini http://www.kaggle.com üzerinde paylaştım. Bu datasetin nasıl kullanılacağına ait notebook https://www.kaggle.com/ahmetax/d/ahmetax/hury-dataset/tr-training adresinde. Aynı notebook sayfasının Türkçe açıklamalar içeren çatalı da bu adreste yer alıyor: https://www.kaggle.com/ahmetax/d/ahmetax/hury-dataset/fork-of-tr-training Bu veri setinin eğitilmiş halinden elde edilen ilişkileri 2-boyutlu bir diyagramda görselleştiren grafik şu: Sözcükleri eğitip ilişkilendiren ve sonuçların bir kısmını görselleştiren Python 3.5.2 kodlarını ilgili sayfalardan inceleyebilir, indirebilir […]

Ağu 262016
 
4.424 viewsEğitilmiş word2vec datasını nasıl kullanırız?

Eğitilmiş word2vec datasını nasıl kullanırız? Elbette bu tür çalışmalarımızı Python ile yapıyoruz. Üstelik interaktif denemeler yapıyorsak, iPython kullanmamız daha doğru. iPython son dönemde jupyter ile entegre çalışıyor. Bu yüzden önce kullanmakta olduğunuz Python sürümünü aktif hale getirin. Ben Python 3.5.1 kullanıyorum ve bunun için tanımladığım evp35 isimli bir sanal ortamım var. Sanal ortamımı devreye sokuyorum: source ~/evp35/bin/activate Artık “python” komutum doğrudan python 3.5.1 sürümünü devreye […]

Ağu 262016
 
5.227 viewsHürriyet Gazetesi Datasıyla Derin Öğrenme Çalışmaları

Hürriyet Gazetesi Datasıyla Derin Öğrenme Çalışmaları Açık Kaynaklı DerlemTR Projesi‘nin yeni aşamasında, Hürriyet Gazetesi yetkilileri “derin öğrenme” (deep learning) konulu çalışmalarımızda gazete arşivlerinden yararlanma isteğimizi yine olumlu karşıladı. Başta Sayın Ersay Dizman olmak üzere, gazete yetkililerine tekrar teşekkür ediyorum. Bu aşamada yine python dilini kullandım ve 2010 yılı Hürriyet Gazetesi arşivlerini taratarak “uygun” haberleri bir araya topladım. Haberlerin tarihi, başlığı, muhabiri veya yazarı belli değil. […]