Eki 152016
 
1.838 viewsHürriyet Data Örneği Kaggle Datasette

Hürriyet Data Örneği Kaggle Datasette Hürriyet Gazetesi haberlerinden türettiğim veri dosyalarından birini http://www.kaggle.com üzerinde paylaştım. Bu datasetin nasıl kullanılacağına ait notebook https://www.kaggle.com/ahmetax/d/ahmetax/hury-dataset/tr-training adresinde. Aynı notebook sayfasının Türkçe açıklamalar içeren çatalı da bu adreste yer alıyor: https://www.kaggle.com/ahmetax/d/ahmetax/hury-dataset/fork-of-tr-training Bu veri setinin eğitilmiş halinden elde edilen ilişkileri 2-boyutlu bir diyagramda görselleştiren grafik şu: Sözcükleri eğitip ilişkilendiren ve sonuçların […]

Eki 012016
 
2.491 viewsGensim Vektörel Doküman Eğitimi

Gensim Vektörel Doküman Eğitimi Tıpkı word2vec yöntemi gibi, gensim paketinin doc2vec metodunu da kullanabilirsiniz. Buradaki amaç sözcükler yerine dokümanlar arasındaki ilişkileri vektörel olarak belirleyip, gruplamaktır. Bu alandaki çalışmalar word2vec’e kıyasla çok daha kısıtlı. Öyle sanıyorum ki, sonuçların word2vec kadar kolay anlaşılır ve çarpıcı olmaması, bu durumun belirleyici unsurlarından biri. Dün bir doc2vec çalışması yaptım. Veri […]