Türkçe Haber Metinlerinin Çok Terimli Naive Bayes Algoritması Kullanılarak Sınıflandırılması
     
Yazarlar (3)
Emrah Aydemir
Sakarya Üniversitesi, Türkiye
Dr. Öğr. Üyesi Murat IŞIK Kırşehir Ahi Evran Üniversitesi, Türkiye
Türker Tuncer
Fırat Üniversitesi, Türkiye
Makale Türü Açık Erişim Özgün Makale (Ulusal alan endekslerinde (TR Dizin, ULAKBİM) yayınlanan tam makale)
Dergi Adı Fırat Üniversitesi Mühendislik Bilimleri Dergisi
Dergi ISSN 1308-9072
Dergi Tarandığı Indeksler TR DİZİN
Makale Dili Türkçe Basım Tarihi 01-2021
Cilt / Sayı / Sayfa 33 / 2 / 519–526 DOI 10.35234/fumbd.871986
Özet
Hızla gelişen teknoloji ile verilere erişmek oldukça kolaylaşmış ancak elde edilen bu veri yığınlarının işlenmesi ve analiz edilmesi ise büyük bir problem haline gelmiştir. Bu çalışmada çevrimiçi bir haber sitesinden metin halinde toplanan yazıların, metin madenciliği ile daha önceden belirlenmiş haber kategorilerine ayrılması sağlanmıştır. Metin halinde toplanan 2248 haber verisi için iki ayrı yöntem kullanılmış ve haberlerin, birinci yöntemde %95,24'ü ikinci yöntemde ise %99,86'sı doğru olarak sınıflandırılmıştır. Türkçe dilinin özgün yapısından kaynaklı sınıflandırma yapılmasının zorluğundan dolayı bu çalışma ileriki metin madenciliği uygulamaları için faydalı olacaktır. Ayrıca elde edilen sonuçlar, literatürde yer edinmiş benzer çalışmalar ile karşılaştırılarak analiz edilmiştir.
Anahtar Kelimeler
Metin madenciliği | veri madenciliği | metin sınıflandırma | naive bayes | rastgele orman | makine öğrenmesi