img
img
OCR Error Correction Using BiLSTM       
Yazarlar (3)
Dr. Öğr. Üyesi Ayla KAYABAŞ Dr. Öğr. Üyesi Ayla KAYABAŞ
Kırşehir Ahi Evran Üniversitesi, Türkiye
Ahmet Ercan Topcu
Ankara Medipol Üniversitesi, Türkiye
Özkan Kılıç
Türkiye
Devamını Göster
Özet
Language models have critical importance in the pre- and post-processing of optical character recognition (OCR). The quality of documents and scanners is important for OCR systems, with inferior quality leading to more erroneous output. For long time intervals of sequences, long short-term memory (LSTM) fulfills the requirements because it can solve problems with long-term dependencies. In this study, we evaluate the performance of error correction for OCR data using LSTM. The results show that we have good performance for correcting error words by using bidirectional LSTM (BiLSTM). We obtain 98.13% better performance in correcting error words by using OCRd data and 97.18% better performance by using social media data. In this respect, we show that the method we have applied can be used for error corrections.
Anahtar Kelimeler
error correction | long short-term memory (LSTM) | non-word error | optical character recognition (OCR) | real-word error
Bildiri Türü Tebliğ/Bildiri
Bildiri Alt Türü Tam Metin Olarak Yayımlanan Tebliğ (Uluslararası Kongre/Sempozyum)
Bildiri Niteliği Web of Science Kapsamındaki Kongre/Sempozyum
Bildiri Dili İngilizce
Kongre Adı Uluslararası Konferans
Kongre Tarihi 10-12-2021 /
Basıldığı Ülke
Basıldığı Şehir
BM Sürdürülebilir Kalkınma Amaçları
Atıf Sayıları
WoS 1
SCOPUS 2
Google Scholar 4
ResearchGate 3
OCR Error Correction Using BiLSTM

Paylaş