img
Türkçe Haber Metinlerinin Çok Terimli Naive Bayes Algoritması Kullanılarak Sınıflandırılması   
Yazarlar
Emrah Aydemir
Türkiye
Dr. Öğr. Üyesi Murat IŞIK
Kırşehir Ahi Evran Üniversitesi, Türkiye
Türker Tuncer
Türkiye
Özet
Hızla gelişen teknoloji ile verilere erişmek oldukça kolaylaşmış ancak elde edilen bu veri yığınlarının işlenmesi ve analiz edilmesi ise büyük bir problem haline gelmiştir. Bu çalışmada çevrimiçi bir haber sitesinden metin halinde toplanan yazıların, metin madenciliği ile daha önceden belirlenmiş haber kategorilerine ayrılması sağlanmıştır. Metin halinde toplanan 2248 haber verisi için iki ayrı yöntem kullanılmış ve haberlerin, birinci yöntemde %95,24'ü ikinci yöntemde ise %99,86'sı doğru olarak sınıflandırılmıştır. Türkçe dilinin özgün yapısından kaynaklı sınıflandırma yapılmasının zorluğundan dolayı bu çalışma ileriki metin madenciliği uygulamaları için faydalı olacaktır. Ayrıca elde edilen sonuçlar, literatürde yer edinmiş benzer çalışmalar ile karşılaştırılarak analiz edilmiştir.
Anahtar Kelimeler
Metin madenciliği,veri madenciliği,metin sınıflandırma,naive bayes,rastgele orman,makine öğrenmesi
Makale Türü Özgün Makale
Makale Alt Türü Ulusal alan endekslerinde (TR Dizin, ULAKBİM) yayımlanan tam makale
Dergi Adı Fırat Üniversitesi Mühendislik Bilimleri Dergisi
Dergi ISSN 1308-9072
Dergi Tarandığı Indeksler TR DİZİN
Makale Dili Türkçe
Basım Tarihi 01-2021
Doi Numarası 10.35234/fumbd.871986
Makale Linki http://dx.doi.org/10.35234/fumbd.871986