https://github.com/ChanChiChoi/awesome-ocr

papers about ocr
https://github.com/ChanChiChoi/awesome-ocr
Last synced: 3 months ago
JSON representation
papers about ocr
Host: GitHub
URL: https://github.com/ChanChiChoi/awesome-ocr
Owner: ChanChiChoi
Created: 2018-01-18T06:56:15.000Z (over 7 years ago)
Default Branch: master
Last Pushed: 2022-10-21T10:41:46.000Z (over 2 years ago)
Last Synced: 2024-05-22T15:06:08.129Z (about 1 year ago)
Homepage:
Size: 277 KB
Stars: 401
Watchers: 32
Forks: 87
Open Issues: 1
Metadata Files:
- Readme: README.md
Awesome Lists containing this project

ultimate-awesome - awesome-ocr - Papers about ocr. (Other Lists / Julia Lists)
README

        # awesome-ocr

some papers and datasets links collected from：

- [1] [wanghaisheng/awesome-ocr](https://github.com/wanghaisheng/awesome-ocr)

- [2] [kba/awesome-ocr](https://github.com/kba/awesome-ocr)

- [3] [chongyangtao/Awesome-Scene-Text-Recognition](https://github.com/chongyangtao/Awesome-Scene-Text-Recognition)

- [4] [whitelok/image-text-localization-recognition](https://github.com/whitelok/image-text-localization-recognition/blob/master/README.zh-cn.md)

- [5] [文字检测与识别资源](http://blog.csdn.net/PeaceInMind/article/details/51387367)

- [6] [OCR material](http://blog.csdn.net/haluoluo211/article/details/54345026)

- [7] [handong1587](https://handong1587.github.io/deep_learning/2015/10/09/ocr.html)

- [8] [hs105/Deep-Learning-for-OCR](https://github.com/hs105/Deep-Learning-for-OCR)

- [9] [文字检测与识别资料整理](https://www.cnblogs.com/lillylin/p/6893500.html)

- [10] [hwalsuklee/awesome-deep-text-detection-recognition](https://github.com/hwalsuklee/awesome-deep-text-detection-recognition)

you can access the website [ICDAR](http://rrc.cvc.uab.es), and see some awesome ocr models on the "Ranking Table" of each competition's result page

---

### 2009

- 【Synthetic data】de T. Campos, B. R. Babu, and M. Varma. [Character recognition in natural images](https://pdfs.semanticscholar.org/0069/36c99dfba0edf6a230dfed2e4e9fba0d230d.pdf). In VISAPP, 2009

### 2010 

- Epshtein B, Ofek E, Wexler Y. [Detecting text in natural scenes with stroke width transform](http://www.math.tau.ac.il/~turkel/imagepapers/text_detection.pdf)[C]//Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on. IEEE, 2010: 2963-2970.


       **code**:[[code](https://github.com/aperrau/DetectText)]

### 2011

- Rusinol M, Aldavert D, Toledo R, et al. [Browsing heterogeneous document collections by a segmentation-free word spotting method](http://www.cvc.uab.es/people/aldavert/documents/conferences/icdar2011.pdf)[C]//Document Analysis and Recognition (ICDAR), 2011 International Conference on. IEEE, 2011: 63-67.

- Neumann L, Matas J. [Text localization in real-world images using efficiently pruned exhaustive search](http://cmp.felk.cvut.cz/~neumalu1/icdar2011_article.pdf)[C]//Document Analysis and Recognition (ICDAR), 2011 International Conference on. IEEE, 2011: 687-691.

### 2012

- 【Synthetic data】Wang T, Wu D J, Coates A, et al. [End-to-end text recognition with convolutional neural networks](http://www.cs.stanford.edu/~acoates/papers/wangwucoatesng_icpr2012.pdf)[C]//Pattern Recognition (ICPR), 2012 21st International Conference on. IEEE, 2012: 3304-3308.


       **code**:[[code](http://cs.stanford.edu/people/twangcat/ICPR2012_code/SceneTextCNN_demo.tar)]

- Elagouni K, Garcia C, Mamalet F, et al. [Text recognition in videos using a recurrent connectionist approach](https://hal.archives-ouvertes.fr/hal-00753906/file/ICANN.pdf)[C]//International Conference on Artificial Neural Networks. Springer, Berlin, Heidelberg, 2012: 172-179.

- Frinken V, Fischer A, Manmatha R, et al. [A novel word spotting method based on recurrent neural networks](https://pdfs.semanticscholar.org/17c0/413c68b69f39f94ee1246fabc0d868a8b254.pdf)[J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 34(2): 211-224.

- Neumann L, Matas J. [Real-time scene text localization and recognition](http://fadaei.semnan.ac.ir/uploads/MV7.pdf)[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 3538-3545.


       **code**:[[code](http://docs.opencv.org/3.0-beta/modules/text/doc/erfilter.html)]

- Mishra A, Alahari K, Jawahar C V. [Top-down and bottom-up cues for scene text recognition](https://hal.inria.fr/hal-00818178/document)[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 2687-2694.

### 2013

- Yin X C, Yin X, Huang K, et al. [Robust text detection in natural scene images](https://arxiv.org/abs/1301.2628)[J]. IEEE transactions on pattern analysis and machine intelligence, 2014, 36(5): 970-983.

- Bissacco A, Cummins M, Netzer Y, et al. [Photoocr: Reading text in uncontrolled conditions](http://www.cv-foundation.org/openaccess/content_iccv_2013/papers/Bissacco_PhotoOCR_Reading_Text_2013_ICCV_paper.pdf)[C]//Proceedings of the IEEE International Conference on Computer Vision. 2013: 785-792.

- Breuel T M, Ul-Hasan A, Al-Azawi M A, et al. [High-performance OCR for printed English and Fraktur using LSTM networks](http://www.academia.edu/download/31806084/2013-breuel-high-performance-ocr-for-english-and-fraktur-using-lstm-networks.pdf)[C]//Document Analysis and Recognition (ICDAR), 2013 12th International Conference on. IEEE, 2013: 683-687.


       **code**:[[code]()]

- Milyaev S, Barinova O, Novikova T, et al. [Image binarization for end-to-end text understanding in natural images](https://www.microsoft.com/en-us/research/wp-content/uploads/2016/11/mbnlk_icdar2013.pdf)[C]//Document Analysis and Recognition (ICDAR), 2013 12th International Conference on. IEEE, 2013: 128-132.

- Neumann L, Matas J. [On combining multiple segmentations in scene text recognition](ftp://cmp.felk.cvut.cz/pub/cmp/articles/matas/neumann-2013-multisegmentation-icdar.pdf)[C]//Document Analysis and Recognition (ICDAR), 2013 12th International Conference on. IEEE, 2013: 523-527.

- Koo H I, Kim D H. Scene text detection via connected component clustering and nontext filtering[J]. IEEE transactions on image processing, 2013, 22(6): 2296-2305.

- Shi C, Wang C, Xiao B, et al. [Scene text recognition using part-based tree-structured character detection](http://www.cv-foundation.org/openaccess/content_cvpr_2013/papers/Shi_Scene_Text_Recognition_2013_CVPR_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2013: 2961-2968.

- Halima M B, Karray H, Alimi A M. [Arabic text recognition in video sequences](https://arxiv.org/abs/1308.3243)[J]. arXiv preprint arXiv:1308.3243, 2013.

- Zaghden N, Khelifi B, Alimi A M, et al. [Text Recognition in both ancient and cartographic documents](https://arxiv.org/abs/1308.6309)[J]. arXiv preprint arXiv:1308.6309, 2013.

- Alsharif O, Pineau J. [End-to-end text recognition with hybrid HMM maxout models](https://arxiv.org/abs/1310.1811)[J]. arXiv preprint arXiv:1310.1811, 2013.

- Louradour J, Kermorvant C. [Curriculum learning for handwritten text line recognition](https://arxiv.org/abs/1312.1737)[C]//Document Analysis Systems (DAS), 2014 11th IAPR International Workshop on. IEEE, 2014: 56-60.

- Goodfellow I J, Bulatov Y, Ibarz J, et al. [Multi-digit number recognition from street view imagery using deep convolutional neural networks](https://arxiv.org/abs/1312.6082)[J]. arXiv preprint arXiv:1312.6082, 2013.	

### 2014

- Bušta M, Drtina T, Helekal D, et al. [Efficient character skew rectification in scene text images](https://pdfs.semanticscholar.org/7874/6473cbf9452cd0d35f7bbbb26b50ef9dc730.pdf)[C]//Asian Conference on Computer Vision. Springer, Cham, 2014: 134-146.

- Almazán J, Gordo A, Fornés A, et al. [Word spotting and recognition with embedded attributes](http://www.cvc.uab.es/~afornes/publi/journals/2014_PAMI_Almazan.pdf)[J]. IEEE transactions on pattern analysis and machine intelligence, 2014, 36(12): 2552-2566.


       **code**:[[code](https://github.com/almazan/watts)]

- Jaderberg M, Vedaldi A, Zisserman A. [Deep features for text spotting](http://www.robots.ox.ac.uk/~vedaldi/assets/pubs/jaderberg14deep.pdf)[C]//European conference on computer vision. Springer, Cham, 2014: 512-528.


       **code**:[[code](https://bitbucket.org/jaderberg/eccv2014_textspotting)]

- Bluche T, Ney H, Kermorvant C. [A comparison of sequence-trained deep neural networks and recurrent neural networks optical modeling for handwriting recognition](https://pdfs.semanticscholar.org/dc34/9f4ad3823720010ec8201856ff38a8538057.pdf)[C]//International Conference on Statistical Language and Speech Processing. Springer, Cham, 2014: 199-210.

- Yao C, Bai X, Liu W. [A unified framework for multioriented text detection and recognition](http://mclab.eic.hust.edu.cn/UpLoadFiles/Papers/[21]%202014%20TIP%20Yaocong.pdf)[J]. IEEE Transactions on Image Processing, 2014, 23(11): 4737-4749.

- Huang W, Qiao Y, Tang X. [Robust scene text detection with convolution neural network induced mser trees](http://www.whuang.org/papers/whuang2014_eccv.pdf)[C]//European Conference on Computer Vision. Springer, Cham, 2014: 497-511.

- Bhowmick S, Banerjee P. [Bangla text recognition from video sequence: A new focus](https://arxiv.org/abs/1401.1190)[J]. arXiv preprint arXiv:1401.1190, 2014.

- 【Synthetic data】Jaderberg M, Simonyan K, Vedaldi A, et al. [Synthetic data and artificial neural networks for natural scene text recognition](https://arxiv.org/abs/1406.2227)[J]. arXiv preprint arXiv:1406.2227, 2014.


       **code**:[[model](http://www.robots.ox.ac.uk/~vgg/research/text/model_release.tar.gz);[offical website](http://www.robots.ox.ac.uk/~vgg/data/text/)]

- Jaderberg M, Simonyan K, Vedaldi A, et al. [Reading text in the wild with convolutional neural networks](https://arxiv.org/abs/1412.1842)[J]. International Journal of Computer Vision, 2016, 116(1): 1-20.


       **offical website**:[[offical website](http://www.robots.ox.ac.uk/~vgg/research/text/)]

- Jaderberg M, Simonyan K, Vedaldi A, et al. [Deep structured output learning for unconstrained text recognition](https://arxiv.org/abs/1412.5903)[J]. arXiv preprint arXiv:1412.5903, 2014.

### 2015

- Kim B S, Koo H I, Cho N I. Document dewarping via text-line based optimization[J]. Pattern Recognition, 2015, 48(11): 3600-3614.

- Ye Q, Doermann D. Text detection and recognition in imagery: A survey[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(7): 1480-1500.

- Jaderberg M. Deep learning for text spotting[D]. University of Oxford, 2015.

- Ren X, Chen K, Yang X, et al. A new unsupervised convolutional neural network model for Chinese scene text detection[C]//Signal and Information Processing (ChinaSIP), 2015 IEEE China Summit and International Conference on. IEEE, 2015: 428-432.

- Wang Z, Yang J, Jin H, et al. [Deepfont: Identify your font from an image](https://arxiv.org/abs/1507.03196)[C]//Proceedings of the 23rd ACM international conference on Multimedia. ACM, 2015: 451-459.

- Gomez L, Karatzas D. [Object proposals for text extraction in the wild](https://arxiv.org/abs/1509.02317)[C]//Document Analysis and Recognition (ICDAR), 2015 13th International Conference on. IEEE, 2015: 206-210.[[code]( https://github.com/lluisgomez/TextProposals)]

- Shi B, Yao C, Zhang C, et al. [Automatic script identification in the wild](https://arxiv.org/abs/1505.02982)[C]//Document Analysis and Recognition (ICDAR), 2015 13th International Conference on. IEEE, 2015: 531-535.

- Busta M, Neumann L, Matas J. [Fastext: Efficient unconstrained scene text detector](http://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Busta_FASText_Efficient_Unconstrained_ICCV_2015_paper.pdf)[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 1206-1214.[[code](https://github.com/MichalBusta/FASText)]

- Zhang Z, Shen W, Yao C, et al. [Symmetry-based text line detection in natural scenes](http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Zhang_Symmetry-Based_Text_Line_2015_CVPR_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2015: 2558-2567.


       **code**:[[code](https://github.com/stupidZZ/Symmetry_Text_Line_Detection)]

- Ray A, Rajeswar S, Chaudhury S. [A hypothesize-and-verify framework for text recognition using deep recurrent neural networks](https://arxiv.org/abs/1502.07540)[C]//Document Analysis and Recognition (ICDAR), 2015 13th International Conference on. IEEE, 2015: 936-940.

- Neumann L, Matas J. [Efficient scene text localization and recognition with local character refinement](https://arxiv.org/abs/1504.03522)[C]//Document Analysis and Recognition (ICDAR), 2015 13th International Conference on. IEEE, 2015: 746-750.

- Visin F, Kastner K, Cho K, et al. [Renet: A recurrent neural network based alternative to convolutional networks](https://arxiv.org/abs/1505.00393)[J]. arXiv preprint arXiv:1505.00393, 2015.

- Zhong Z, Jin L, Xie Z. [High performance offline handwritten chinese character recognition using googlenet and directional feature maps](https://arxiv.org/abs/1505.04925)[C]//Document Analysis and Recognition (ICDAR), 2015 13th International Conference on. IEEE, 2015: 846-850.


       **code**:[[code](https://github.com/zhongzhuoyao/HCCR-GoogLeNet)]

- 【CRNN】Shi B, Bai X, Yao C. [An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition](https://arxiv.org/abs/1507.05717)[J]. IEEE transactions on pattern analysis and machine intelligence, 2017, 39(11): 2298-2304.


       **code**:【1 - [offical](https://github.com/bgshih/crnn)】; 【2 - [crnn.pytorch](https://github.com/meijieru/crnn.pytorch)】; 【3 - [unfinished](https://github.com/Belval/CRNN)】; 【4 - [crnn.pytorch-chinese](https://github.com/wulivicte/crnn)】; 【5 - [crnn+stn-tf](https://github.com/chengzhang/CRNN)】; 【6 - [lstm+ctc](https://github.com/ilovin/lstm_ctc_ocr)】; 【7 - [ctpn+crnn-merge-cannot-train](https://github.com/bear63/sceneReco)】; 【8 - [crnn-mnist-keras](https://github.com/jamesmf/mnistCRNN)】; 【9 - [crnn-tf](https://github.com/TJCVRS/CRNN_Tensorflow)】; 【10 - [crnn-tf-could-be-better](https://github.com/AimeeKing/crnn-tensorflow)】; 【11 - [crnn.mxnet](https://github.com/novioleo/crnn.mxnet)】; 【12 - [crnn-tf-estimators](https://github.com/solivr/tf-crnn)】; 【13 - [crnn-attention-tf](https://github.com/wushilian/CRNN_Attention_OCR_Chinese)】; 【14 - [crnn.caffe](https://github.com/yalecyu/crnn.caffe)】; 【15 - [chinese.ocr-ctpn+crnn-tf+pytorch](https://github.com/chineseocr/chinese-ocr)】; 【16 - [another.crnn-attentive pooling](https://github.com/desh2608/crnn-relation-classification)】; 【17 - [crnn-tf-music](https://github.com/meetshah1995/crnn-music-genre-classification)】; 【18 - [crnn-tf-developing](https://github.com/wcy940418/CRNN-end-to-end)】; 【19 - [crnn-torch](https://github.com/yisongbetter/crnn)】; 【20 - [crnn-tf-developing](https://github.com/caihaoye16/crnn)】; 【21 - [chinese-ocr-keras](https://github.com/hehongyu1995/chinese-ocr-train)】; 【22 - [crnn-tf-developing](https://github.com/qiaohan/crnn-train-tf)】; 【23 - [ctpn+crnn-cannot-train-7](https://github.com/qq919056489/ScenceRecognition)】; 【24 - [crnn-pytorch](https://github.com/ahmedmazari-dhatim/CRNN-for-sequence-recognition-)】; 【25 - [cnn+lstm+ctc-tf](https://github.com/watsonyanghx/CNN_LSTM_CTC_Tensorflow)】; 【26 - [crnn-tf-resnet](https://github.com/shoaibahmed/CRNN-TF)]】;【27 - [caffe_ocr](https://github.com/senlinuc/caffe_ocr)】

- He T, Huang W, Qiao Y, et al. [Text-attentional convolutional neural network for scene text detection](https://arxiv.org/abs/1510.03283)[J]. IEEE transactions on image processing, 2016, 25(6): 2529-2541.

- Sahu D K, Sukhwani M. [Sequence to sequence learning for optical character recognition](https://arxiv.org/abs/1511.04176)[J]. arXiv preprint arXiv:1511.04176, 2015.

- Hosseini-Asl E, Guha A. [Similarity-based Text Recognition by Deeply Supervised Siamese Network](https://arxiv.org/abs/1511.04397)[J]. arXiv preprint arXiv:1511.04397, 2015.

- Wang D H, Wang H, Zhang D, et al. [Robust Scene Text Recognition Using Sparse Coding based Features](https://arxiv.org/abs/1512.08669)[J]. arXiv preprint arXiv:1512.08669, 2015.

### 2016

- Yin X C, Zuo Z Y, Tian S, et al. Text detection, tracking and recognition in video: a comprehensive survey[J]. IEEE Transactions on Image Processing, 2016, 25(6): 2752-2773.

- Zhu Y, Yao C, Bai X. [Scene text detection and recognition: Recent advances and future trends](http://mclab.eic.hust.edu.cn/UpLoadFiles/Papers/FCS_TextSurvey_2015.pdf)[J]. Frontiers of Computer Science, 2016, 10(1): 19-36.

- He P, Huang W, Qiao Y, et al. [Reading Scene Text in Deep Convolutional Sequences](http://www.aaai.org/ocs/index.php/AAAI/AAAI16/paper/download/12256/12121)[C]//AAAI. 2016: 3501-3508.


       **code**:[[code](http://www.robots.ox.ac.uk/~vgg/research/text/)]

- Lee C Y, Osindero S. [Recursive recurrent nets with attention modeling for OCR in the wild](http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Lee_Recursive_Recurrent_Nets_CVPR_2016_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 2231-2239.

- 【Synthetic data】Gupta A, Vedaldi A, Zisserman A. [Synthetic data for text localisation in natural images](http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Gupta_Synthetic_Data_for_CVPR_2016_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 2315-2324.


       **code**:[[offical](https://github.com/ankush-me/SynthText);[vgg](http://www.robots.ox.ac.uk/~vgg/data/scenetext/);[other](https://github.com/Belval/TextRecognitionDataGenerator)]

- Sivakorn S, Polakis J, Keromytis A D. [I’m not a human: Breaking the Google reCAPTCHA](http://www.blackhat.com/docs/asia-16/materials/asia-16-Sivakorn-Im-Not-a-Human-Breaking-the-Google-reCAPTCHA-wp.pdf)[J]. Black Hat,(i), 2016: 1-12.

- Sivakorn S, Polakis I, Keromytis A D. [I am robot:(deep) learning to break semantic image captchas](https://mirror.explodie.org/sivakorn_eurosp16.pdf)[C]//Security and Privacy (EuroS&P), 2016 IEEE European Symposium on. IEEE, 2016: 388-403.

- Lee C Y, Osindero S. [Recursive recurrent nets with attention modeling for OCR in the wild](http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Lee_Recursive_Recurrent_Nets_CVPR_2016_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 2231-2239.

- Neumann L, Matas J. [Real-time lexicon-free scene text localization and recognition](https://pdfs.semanticscholar.org/27fb/ffed698729ed309dbc4fa3ba9562c023b9ef.pdf)[J]. IEEE transactions on pattern analysis and machine intelligence, 2016, 38(9): 1872-1885.

- Zhang Z, Zhang C, Shen W, et al. [Multi-oriented text detection with fully convolutional networks](http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Zhang_Multi-Oriented_Text_Detection_CVPR_2016_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 4159-4167.

- Fabrizio J, Robert-Seidowsky M, Dubuisson S, et al. [TextCatcher: a method to detect curved and challenging text in natural scenes](http://www.lrde.epita.fr/dload/papers/fabrizio.16.ijdar.pdf)[J]. International Journal on Document Analysis and Recognition (IJDAR), 2016, 19(2): 99-117.

- Cho H, Sung M, Jun B. [Canny text detector: Fast and robust scene text localization algorithm](http://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Cho_Canny_Text_Detector_CVPR_2016_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 3566-3573.

- Qiang G, Dan T, Guohui L, et al. [Memory Matters: Convolutional Recurrent Neural Network for Scene Text Recognition](https://arxiv.org/abs/1601.01100)[J]. arXiv preprint arXiv:1601.01100, 2016.

- Mishra A, Alahari K, Jawahar C V. [Enhancing energy minimization framework for scene text recognition with top-down cues](https://arxiv.org/abs/1601.03128)[J]. Computer Vision and Image Understanding, 2016, 145: 30-42.

- Li H, Shen C. [Reading car license plates using deep convolutional neural networks and lstms](https://arxiv.org/abs/1601.05610)[J]. arXiv preprint arXiv:1601.05610, 2016.

- 【Dataset】Veit A, Matera T, Neumann L, et al. [Coco-text: Dataset and benchmark for text detection and recognition in natural images](https://arxiv.org/abs/1601.07140)[J]. arXiv preprint arXiv:1601.07140, 2016.

- Huang W. [Context modeling for semantic text matching and scene text detection](https://etda.libraries.psu.edu/files/final_submissions/12356)[M]. The Pennsylvania State University, 2016.

- Tian S, Pei W Y, Zuo Z Y, et al. [Scene Text Detection in Video by Learning Locally and Globally](https://pdfs.semanticscholar.org/bf91/183c6c60a08754ab4b557302501372556394.pdf)[C]//IJCAI. 2016: 2647-2653.

- Shi B, Wang X, Lyu P, et al. [Robust scene text recognition with automatic rectification](https://arxiv.org/abs/1603.03915)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 4168-4176.

- Shuye Zhang, Mude Lin, Tianshui Chen, Lianwen Jin, Liang Lin. [Character Proposal Network for Robust Text Extraction](https://arxiv.org/abs/1602.04348). arXiv preprint arXiv:1602.04348, 2016.

- Lluis Gomez, Dimosthenis Karatzas. [A fine-grained approach to scene text script identification](https://arxiv.org/abs/1602.07475). arXiv preprint arXiv:1602.07475, 2016.

- Lluis Gomez, Anguelos Nicolaou, Dimosthenis Karatzas. [Improving patch-based scene text script identification with ensembles of conjoined networks](https://arxiv.org/abs/1602.07480). arXiv preprint arXiv:1602.07480, 2016.

- He T, Huang W, Qiao Y, et al. [Accurate text localization in natural image with cascaded convolutional text network](https://arxiv.org/abs/1603.09423)[J]. arXiv preprint arXiv:1603.09423, 2016.

- Hafemann L G, Sabourin R, Oliveira L S. [Writer-independent feature learning for offline signature verification using deep convolutional neural networks](https://arxiv.org/abs/1604.00974)[C]//Neural Networks (IJCNN), 2016 International Joint Conference on. IEEE, 2016: 2576-2583.

- Ren X, Chen K, Sun J. [A CNN Based Scene Chinese Text Recognition Algorithm With Synthetic Data Engine](https://arxiv.org/abs/1604.01891)[J]. arXiv preprint arXiv:1604.01891, 2016.

- Xiaohang Ren, Kai Chen, Jun Sun. [A Novel Scene Text Detection Algorithm Based On Convolutional Neural Network](https://arxiv.org/abs/1604.01894). arXiv preprint arXiv:1604.01894, 2016.

- Gómez L, Karatzas D. [Textproposals: a text-specific selective search algorithm for word spotting in the wild](https://arxiv.org/abs/1604.02619)[J]. Pattern Recognition, 2017, 70: 60-74.[[code](https://github.com/lluisgomez/TextProposals)]

- Bluche T, Louradour J, Messina R. [Scan, attend and read: End-to-end handwritten paragraph recognition with mdlstm attention](https://arxiv.org/abs/1604.03286)[J]. arXiv preprint arXiv:1604.03286, 2016.

- Zheng Zhang, Chengquan Zhang, Wei Shen, Cong Yao, Wenyu Liu, Xiang Bai. [Multi-Oriented Text Detection with Fully Convolutional Networks](https://arxiv.org/abs/1604.04018). arXiv preprint arXiv:1604.04018, 2016. 

- Xie Z, Sun Z, Jin L, et al. [Fully convolutional recurrent network for handwritten Chinese text recognition](https://arxiv.org/abs/1604.04953)[C]//Pattern Recognition (ICPR), 2016 23rd International Conference on. IEEE, 2016: 4011-4016.

- Shangxuan Tian, Yifeng Pan, Chang Huang, Shijian Lu, Kai Yu, Chew Lim Tan. [Text Flow: A Unified Text Detection System in Natural Scene Images](https://arxiv.org/abs/1604.06877). arXiv preprint arXiv:1604.06877, 2016.

- Zhong Z, Jin L, Zhang S, et al. [Deeptext: A unified framework for text proposal generation and text detection in natural images](https://arxiv.org/abs/1605.07314)[J]. arXiv preprint arXiv:1605.07314, 2016.

- Zhang X Y, Yin F, Zhang Y M, et al. [Drawing and recognizing chinese characters with recurrent neural network](https://arxiv.org/abs/1606.06539)[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017.

- Yao C, Bai X, Sang N, et al. [Scene text detection via holistic, multi-channel prediction](https://arxiv.org/abs/1606.09002)[J]. arXiv preprint arXiv:1606.09002, 2016.

- Hassanien A M A. [Sequence to sequence learning for unconstrained scene text recognition](https://arxiv.org/abs/1607.06125)[J]. arXiv preprint arXiv:1607.06125, 2016.

- Nitigya Sambyal, Pawanesh Abrol. [Automatic text extraction and character segmentation using maximally stable extremal regions](https://arxiv.org/abs/1608.03374). arXiv preprint arXiv:1608.03374, 2016.

- 【Synthetic data】 Krishnan P, Jawahar C V. [Generating Synthetic Data for Text Recognition](https://arxiv.org/abs/1608.04224)[J]. arXiv preprint arXiv:1608.04224, 2016.

- 【CTPN】Tian Z, Huang W, He T, et al. [Detecting text in natural image with connectionist text proposal network](https://arxiv.org/abs/1609.03605)[C]//European Conference on Computer Vision. Springer International Publishing, 2016: 56-72.


         **code**:[[code](https://github.com/eragonruan/text-detection-ctpn);[cuda8-caffe](https://github.com/qingswu/CTPN);[offical](https://github.com/tianzhi0549/CTPN);[ocr_detection_ctpn](https://github.com/Li-Ming-Fan/OCR-DETECTION-CTPN);[keras_ocr](https://github.com/littleredhat1997/OCR-IDCard)]


         **dataset**:[ICDAR 2011; ICDAR 2013; ICDAR 2015; SWT; Multilingual dataset] 

- Xie Z, Sun Z, Jin L, et al. [Learning spatial-semantic context with fully convolutional recurrent network for online handwritten chinese text recognition](https://arxiv.org/abs/1610.02616)[J]. IEEE transactions on pattern analysis and machine intelligence, 2017.

- Hu B, Liu X, Wu X, et al. [Stroke Sequence-Dependent Deep Convolutional Neural Network for Online Handwritten Chinese Character Recognition](https://arxiv.org/abs/1610.04057)[J]. arXiv preprint arXiv:1610.04057, 2016.

- 【Dataset】Ahmed Ibrahim, A. Lynn Abbott, Mohamed E. Hussein. [An Image Dataset of Text Patches in Everyday Scenes](https://arxiv.org/abs/1610.06494). arXiv preprint arXiv:1610.06494, 2016.

- Lou X, Kansky K, Lehrach W, et al. [Generative Shape Models: Joint Text Recognition and Segmentation with Very Little Training Data](https://arxiv.org/abs/1611.02788)[C]//Advances in Neural Information Processing Systems. 2016: 2793-2801.

- Xu Y, Shan S, Qiu Z, et al. [End-to-End Subtitle Detection and Recognition for Videos in East Asian Languages via CNN Ensemble with Near-Human-Level Performance](https://arxiv.org/abs/1611.06159)[J]. arXiv preprint arXiv:1611.06159, 2016.

- Chengzhe Yan, Jie Hu, Changshui Zhang. [A DNN Framework For Text Image Rectification From Planar Transformations](https://arxiv.org/abs/1611.04298). arXiv preprint arXiv:1611.04298, 2016.

- Minghui Liao, Baoguang Shi, Xiang Bai, Xinggang Wang, Wenyu Liu. [TextBoxes: A Fast Text Detector with a Single Deep Neural Network](https://arxiv.org/abs/1611.06779). arXiv preprint arXiv:1611.06779, 2016.

- Jie Mei, Aminul Islam, Yajing Wu, Abidalrahman Moh'd, Evangelos E. Milios. [Statistical Learning for OCR Text Correction](https://arxiv.org/abs/1611.06950). arXiv preprint arXiv:1611.06950, 2016.

- Yang X, He D, Huang W, et al. [Smart Library: Identifying Books in a Library using Richly Supervised Deep Scene Text Reading](https://arxiv.org/abs/1611.07385)[J]. arXiv preprint arXiv:1611.07385, 2016.

- Junnan Yu, Xuna Ma, Ting Han. [Usability Investigation on the Localization of Text CAPTCHAs: Take Chinese Characters as a Case Study](https://arxiv.org/abs/1612.01070).  arXiv preprint arXiv:1612.01070, 2016.

- Singh Vijendra, Nisha Vasudeva, Hem Jyotsana Parashar. [Recognition of Text Image Using Multilayer Perceptron](https://arxiv.org/abs/1612.00625). arXiv preprint arXiv:1612.00625, 2016.

- Zichuan Liu, Yixing Li, Fengbo Ren, Hao Yu. [A Binary Convolutional Encoder-decoder Network for Real-time Natural Scene Text Processing](https://arxiv.org/abs/1612.03630). arXiv preprint arXiv:1612.03630, 2016.

### 2017

- Kil T, Seo W, Koo H I, et al. Robust Document Image Dewarping Method Using Text-Lines and Line Segments[C]//2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). IEEE, 2017, 1: 865-870.
[code:[xellows1305/Document-Image-Dewarping](https://github.com/xellows1305/Document-Image-Dewarping)]

- Raj D, SAHU S, Anand A. [Learning local and global contexts using a convolutional recurrent network model for relation classification in biomedical text](http://www.aclweb.org/anthology/K17-1032)[C]//Proceedings of the 21st Conference on Computational Natural Language Learning (CoNLL 2017). 2017: 311-321.


       **code**:[[code](https://github.com/desh2608/crnn-relation-classification)]

- Florian Fink, Klaus-U. Schulz, Uwe Springmann. [Profiling of OCR'ed Historical Texts Revisited](https://arxiv.org/abs/1701.05377).  arXiv preprint arXiv:1701.05377, 2017.

- Cheang T K, Chong Y S, Tay Y H. [Segmentation-free Vehicle License Plate Recognition using ConvNet-RNN](https://arxiv.org/abs/1701.06439)[J]. arXiv preprint arXiv:1701.06439, 2017.

- Shahin A A. [Printed Arabic Text Recognition using Linear and Nonlinear Regression](https://arxiv.org/abs/1702.01444)[J]. arXiv preprint arXiv:1702.01444, 2017.

- 【Dataset】Smith R, Gu C, Lee D S, et al. [End-to-end interpretation of the french street name signs dataset](https://arxiv.org/abs/1702.03970)[C]//European Conference on Computer Vision. Springer International Publishing, 2016: 411-426.


       **code**:[[code](https://github.com/tensorflow/models/tree/master/street)]

- Bazazian D, Gomez R, Nicolaou A, et al. [Improving Text Proposals for Scene Images with Fully Convolutional Networks](https://arxiv.org/abs/1702.05089)[J]. arXiv preprint arXiv:1702.05089, 2017.

- 【synthetic Captcha】Le T A, Baydin A G, Zinkov R, et al. [Using Synthetic Data to Train Neural Networks is Model-Based Reasoning](https://arxiv.org/abs/1703.00868)[J]. arXiv preprint arXiv:1703.00868, 2017.

- Jianqi Ma, Weiyuan Shao, Hao Ye, Li Wang, Hong Wang, Yingbin Zheng, Xiangyang Xue. [Arbitrary-Oriented Scene Text Detection via Rotation Proposals](https://arxiv.org/abs/1703.01086). arXiv preprint arXiv:1703.01086, 2017.

- Liu Y, Jin L. [Deep matching prior network: Toward tighter multi-oriented text detection](https://arxiv.org/abs/1703.01425)[J]. arXiv preprint arXiv:1703.01425, 2017.

- Shi B, Bai X, Belongie S. [Detecting Oriented Text in Natural Images by Linking Segments](https://arxiv.org/abs/1703.06520)[J]. arXiv preprint arXiv:1703.06520, 2017.


       **code**:[[code](https://github.com/dengdan/seglink)]

- Masood S Z, Shu G, Dehghan A, et al. [License Plate Detection and Recognition Using Deeply Learned Convolutional Neural Networks](https://arxiv.org/abs/1703.07330)[J]. arXiv preprint arXiv:1703.07330, 2017.

- Liao M, Shi B, Bai X, et al. [TextBoxes: A Fast Text Detector with a Single Deep Neural Network](http://www.aaai.org/ocs/index.php/AAAI/AAAI17/paper/download/14202/14295)[C]//AAAI. 2017: 4161-4167.


       **code**:[[code](https://github.com/xiaodiu2010/TextBoxes-TensorFlow);[code](https://github.com/MhLiao/TextBoxes)]

- He W, Zhang X Y, Yin F, et al. [Deep Direct Regression for Multi-Oriented Scene Text Detection](https://arxiv.org/abs/1703.08289)[J]. arXiv preprint arXiv:1703.08289, 2017.

- Ma J, Shao W, Ye H, et al. [Arbitrary-Oriented Scene Text Detection via Rotation Proposals](https://arxiv.org/abs/1703.01086)[J]. arXiv preprint arXiv:1703.01086, 2017.

- Qin S, Manduchi R. [Cascaded Segmentation-Detection Networks for Word-Level Text Spotting](https://arxiv.org/abs/1704.00834)[J]. arXiv preprint arXiv:1704.00834, 2017.

- Zhou X, Yao C, Wen H, et al. [EAST: An Efficient and Accurate Scene Text Detector](https://arxiv.org/abs/1704.03155)[J]. arXiv preprint arXiv:1704.03155, 2017.


       **code**:[[code](https://github.com/argman/EAST)]

- Wojna Z, Gorban A, Lee D S, et al. [Attention-based Extraction of Structured Information from Street View Imagery](https://arxiv.org/abs/1704.03549)[J]. arXiv preprint arXiv:1704.03549, 2017.
:

       **code**:[[offical](https://github.com/tensorflow/models/tree/master/research/attention_ocr);[similar](https://github.com/da03/Attention-OCR)]

- Moysset B, Kermorvant C, Wolf C. [Full-Page Text Recognition: Learning Where to Start and When to Stop](https://arxiv.org/abs/1704.08628)[J]. arXiv preprint arXiv:1704.08628, 2017.

- Nakamura T, Zhu A, Yanai K, et al. [Scene Text Eraser](https://arxiv.org/abs/1705.02772)[J]. arXiv preprint arXiv:1705.02772, 2017.

- Xiao X, Yang Y, Ahmad T, et al. [Design of a Very Compact CNN Classifier for Online Handwritten Chinese Character Recognition Using DropWeight and Global Pooling](https://arxiv.org/abs/1705.05207)[J]. arXiv preprint arXiv:1705.05207, 2017.

- Polzounov A, Ablavatski A, Escalera S, et al. [WordFence: Text Detection in Natural Images with Border Awareness](https://arxiv.org/abs/1705.05483)[J]. arXiv preprint arXiv:1705.05483, 2017.

- Ghosh S K, Valveny E, Bagdanov A D. [Visual attention models for scene text recognition](https://arxiv.org/abs/1706.01487)[J]. arXiv preprint arXiv:1706.01487, 2017.

- Lyu P, Bai X, Yao C, et al. [Auto-Encoder Guided GAN for Chinese Calligraphy Synthesis](https://arxiv.org/abs/1706.08789)[J]. arXiv preprint arXiv:1706.04041, 2017.

- Shervin Minaee, Yao Wang. [Text Extraction From Texture Images Using Masked Signal Decomposition](https://arxiv.org/abs/1706.04041). arXiv preprint arXiv:1706.08789, 2017.

- Jiang Y, Zhu X, Wang X, et al. [R2CNN: Rotational Region CNN for Orientation Robust Scene Text Detection](https://arxiv.org/abs/1706.09579)[J]. arXiv preprint arXiv:1706.09579, 2017.

- Ghosh S, Valveny E. [R-PHOC: Segmentation-Free Word Spotting using CNN](https://arxiv.org/abs/1707.01294)[J]. arXiv preprint arXiv:1707.01294, 2017.

- Wang X, You M, Shen C. [Adversarial generation of training examples for vehicle license plate recognition](https://arxiv.org/abs/1707.03124)[J]. arXiv preprint arXiv:1707.03124, 2017.

- Li H, Wang P, Shen C. [Towards End-to-end Text Spotting with Convolutional Recurrent Neural Networks](https://arxiv.org/abs/1707.03985)[J]. arXiv preprint arXiv:1707.03985, 2017.

- Aneeshan Sain, Ayan Kumar Bhunia, Partha Pratim Roy, Umapada Pal. [Multi-Oriented Text Detection and Verification in Video Frames and Scene Images](https://arxiv.org/abs/1707.07150). arXiv preprint arXiv:1707.07150, 2017.

- Bhunia A K, Kumar G, Roy P P, et al. [Text recognition in scene image and video frame using Color Channel selection](https://arxiv.org/abs/1707.06810)[J]. Multimedia Tools and Applications, 2017: 1-28.

- Partha Pratim Roy, Ayan Kumar Bhunia, Umapada Pal. [Date-Field Retrieval in Scene Image and Video Frames using Text Enhancement and Shape Coding](https://arxiv.org/abs/1707.06833). arXiv preprint arXiv:1707.06833, 2017.

- Bartz C, Yang H, Meinel C. [STN-OCR: A single Neural Network for Text Detection and Text Recognition](https://arxiv.org/abs/1707.08831)[J]. arXiv preprint arXiv:1707.08831, 2017.


       **code**:[[code](https://github.com/Bartzi/stn-ocr)]

- Jiang F, Hao Z, Liu X. [Deep Scene Text Detection with Connected Component Proposals](https://arxiv.org/abs/1708.05133)[J]. arXiv preprint arXiv:1708.05133, 2017.

- Amarnath R, P. Nagabhushan. [Spotting Separator Points at Line Terminals in Compressed Document Images for Text-line Segmentation](https://arxiv.org/abs/1708.05545). arXiv preprint arXiv:1708.05545, 2017.

- P. Shivakumara, D. S. Guru, H.T. Basavaraju. [Color and Gradient Features for Text Segmentation from Video Frames](https://arxiv.org/abs/1708.06561).  arXiv preprint arXiv:1708.06561, 2017.

- Hu H, Zhang C, Luo Y, et al. [Wordsup: Exploiting word annotations for character based text detection](https://arxiv.org/abs/1708.06720)[C]//Proceedings of the IEEE International Conference on Computer Vision. 2017.

- He P, Huang W, He T, et al. [Single shot text detector with regional attention](https://arxiv.org/abs/1709.00138)[C]//The IEEE International Conference on Computer Vision (ICCV). 2017.


       **code**:[[code](https://github.com/BestSonny/SSTD);[code](http://sstd.whuang.org)]

- Yin F, Wu Y C, Zhang X Y, et al. [Scene Text Recognition with Sliding Convolutional Character Models](https://arxiv.org/abs/1709.01727)[J]. arXiv preprint arXiv:1709.01727, 2017.

- Ekta Vats, Anders Hast. [On-the-fly Historical Handwritten Text Annotation](https://arxiv.org/abs/1709.01775). arXiv preprint arXiv:1709.01775, 2017. 

- Cheng Z, Bai F, Xu Y, et al. [Focusing Attention: Towards Accurate Text Recognition in Natural Images](https://arxiv.org/abs/1709.02054)[C]//2017 IEEE International Conference on Computer Vision (ICCV). IEEE, 2017: 5086-5094.

- Dai Y, Huang Z, Gao Y, et al. [Fused Text Segmentation Networks for Multi-oriented Scene Text Detection](https://arxiv.org/abs/1709.03272)[J]. arXiv preprint arXiv:1709.03272, 2017.

- Teresa Nicole Brooks. [Exploring Geometric Property Thresholds For Filtering Non-Text Regions In A Connected Component Based Text Detection Application](https://arxiv.org/abs/1709.03548). arXiv preprint arXiv:1709.03548, 2017.

- Yunze Gao, Yingying Chen, Jinqiao Wang, Hanqing Lu .[Reading Scene Text with Attention Convolutional Sequence Modeling](https://arxiv.org/abs/1709.04303). arXiv preprint arXiv:1709.04303, 2017.

- Li H, Wang P, Shen C. [Towards End-to-End Car License Plates Detection and Recognition with Deep Neural Networks](https://arxiv.org/abs/1709.08828)[J]. arXiv preprint arXiv:1709.08828, 2017.

- Kazem Qazanfari, Saeed Shiri. [Real time text localization for Indoor Mobile Robot Navigation](https://arxiv.org/abs/1709.09634). arXiv preprint arXiv:1709.09634, 2017. 

- Zhan H, Wang Q, Lu Y. [Handwritten digit string recognition by combination of residual network and RNN-CTC](https://arxiv.org/abs/1710.03112)[C]//International Conference on Neural Information Processing. Springer, Cham, 2017: 583-591.

- Yang C, Yin X C, Li Z, et al. [AdaDNNs: Adaptive Ensemble of Deep Neural Networks for Scene Text Recognition](https://arxiv.org/abs/1710.03425)[J]. arXiv preprint arXiv:1710.03425, 2017.

- Tian S, Lu S, Li C. [WeText: Scene Text Detection under Weak Supervision](https://arxiv.org/abs/1710.04826)[J]. arXiv preprint arXiv:1710.04826, 2017.

- 【Dataset】Kheng Chng C, Chan C S. [Total-Text: A Comprehensive Dataset for Scene Text Detection and Recognition](https://arxiv.org/abs/1710.10400)[J]. arXiv preprint arXiv:1710.10400, 2017.

- Jain M, Mathew M, Jawahar C V. [Unconstrained scene text and video text recognition for Arabic script](https://arxiv.org/abs/1711.02396)[C]//Arabic Script Analysis and Recognition (ASAR), 2017 1st International Workshop on. IEEE, 2017: 26-30.

- Ren H, Wang W. [A New Hybrid-parameter Recurrent Neural Networks for Online Handwritten Chinese Character Recognition](https://arxiv.org/abs/1711.02809)[J]. arXiv preprint arXiv:1711.02809, 2017.

- Zhu X, Jiang Y, Yang S, et al. [Deep Residual Text Detection Network for Scene Text](https://arxiv.org/abs/1711.04147)[J]. arXiv preprint arXiv:1711.04147, 2017.

- Cheng Z, Liu X, Bai F, et al. [Arbitrarily-Oriented Text Recognition](https://arxiv.org/abs/1711.04226)[J]. arXiv preprint arXiv:1711.04226, 2017.

- Zhang S, Liu Y, Jin L, et al. [Feature Enhancement Network: A Refined Scene Text Detector](https://arxiv.org/abs/1711.04249)[J]. arXiv preprint arXiv:1711.04249, 2017.

- Xing D, Li Z, Chen X, et al. [ArbiText: Arbitrary-Oriented Text Detection in Unconstrained Scene](https://arxiv.org/abs/1711.11249)[J]. arXiv preprint arXiv:1711.11249, 2017.

- 【Dataset】Yuliang L, Lianwen J, Shuaitao Z, et al. [Detecting Curve Text in the Wild: New Dataset and New Solution](https://arxiv.org/abs/1712.02170)[J]. arXiv preprint arXiv:1712.02170, 2017.


       **code**:[[code](https://github.com/Yuliang-Liu/Curve-Text-Detector)]

- Jason Poulos, Rafael Valle. [Attention networks for image-to-text](https://arxiv.org/abs/1712.04046). arXiv preprint arXiv:1712.04046, 2017.

- Aarushi Agrawal, Prerana Mukherjee, Siddharth Srivastava, Brejesh Lall. [Enhanced Characterness for Text Detection in the Wild](https://arxiv.org/abs/1712.04927). arXiv preprint arXiv:1712.04927, 2017.

- Bartz C, Yang H, Meinel C. [SEE: Towards Semi-Supervised End-to-End Scene Text Recognition](https://arxiv.org/abs/1712.05404)[J]. arXiv preprint arXiv:1712.05404, 2017.

- Kang C, Kim G, Yoo S I. [Detection and Recognition of Text Embedded in Online Images via Neural Context Models](http://www.aaai.org/ocs/index.php/AAAI/AAAI17/paper/download/14154/14287)[C]//AAAI. 2017: 4103-4110.


       **code**:[[code](https://github.com/cmkang/CTSN)]

- Busta M, Neumann L, Matas J. [Deep TextSpotter: An End-to-End Trainable Scene Text Localization and Recognition Framework](https://pdfs.semanticscholar.org/64ff/7f81f066a26a40f52e41931a97c166db094d.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 2204-2212.[[code](https://github.com/MichalBusta/DeepTextSpotter)]

- Wu Y, Natarajan P. [Self-organized Text Detection with Minimal Post-processing via Border Learning](http://openaccess.thecvf.com/content_ICCV_2017/papers/Wu_Self-Organized_Text_Detection_ICCV_2017_paper.pdf)[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 5000-5009.

- Rong X, Yi C, Tian Y. [Unambiguous text localization and retrieval for cluttered scenes](http://openaccess.thecvf.com/content_cvpr_2017/papers/Rong_Unambiguous_Text_Localization_CVPR_2017_paper.pdf)[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017: 3279-3287.

### 2018

- Deng D, Liu H, Li X, et al. [PixelLink: Detecting Scene Text via Instance Segmentation](https://arxiv.org/abs/1801.01315)[J]. arXiv preprint arXiv:1801.01315, 2018.

- Agnese Chiatti, Mu Jung Cho, Anupriya Gagneja, Xiao Yang, Miriam Brinberg, Katie Roehrick, Sagnik Ray Choudhury, Nilam Ram, Byron Reeves, C. Lee Giles. [Text Extraction and Retrieval from Smartphone Screenshots: Building a Repository for Life in Media](https://arxiv.org/abs/1801.01316). arXiv preprint arXiv:1801.01316, 2018.

- Liu X, Liang D, Yan S, et al. [FOTS: Fast Oriented Text Spotting with a Unified Network](https://arxiv.org/abs/1801.01671)[J]. arXiv preprint arXiv:1801.01671, 2018.

- Liao M, Shi B, Bai X. [TextBoxes++: A Single-Shot Oriented Scene Text Detector](https://arxiv.org/abs/1801.02765)[J]. arXiv preprint arXiv:1801.02765, 2018.

- Anders Hast, Per Cullhed, Ekta Vats. [TexT - Text Extractor Tool for Handwritten Document Transcription and Annotation](https://arxiv.org/abs/1801.05367). arXiv preprint arXiv:1801.05367, 2018.

- Yash Patel, Michal Bušta, Jiri Matas. [E2E-MLT - an Unconstrained End-to-End Method for Multi-Language Scene Text](https://arxiv.org/abs/1801.09919v1). arXiv preprint arXiv:1801.09919, 2018.

- Yixing Zhu, Jun Du. [Sliding Line Point Regression for Shape Robust Scene Text Detection](https://arxiv.org/abs/1801.09969v1). arXiv preprint arXiv:1801.09969, 2018.

- Tobias Grüning, Gundram Leifert, Tobias Strauß, Roger Labahn. [A Two-Stage Method for Text Line Detection in Historical Documents](https://arxiv.org/abs/1802.03345). arXiv preprint arXiv:1802.03345, 2018.

- Congzheng Song, Vitaly Shmatikov. [Fooling OCR Systems with Adversarial Text Images](https://arxiv.org/abs/1802.05385v1). arXiv preprint arXiv:1802.05385, 2018.

- Pengyuan Lyu, Cong Yao, Wenhao Wu, Shuicheng Yan, Xiang Bai. [Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation](https://arxiv.org/abs/1802.08948v2). arXiv preprint arXiv:1802.08948, 2018.

- Tai-Ling Yuan, Zhe Zhu, Kun Xu, Cheng-Jun Li, Shi-Min Hu. [Chinese Text in the Wild](https://arxiv.org/abs/1803.00085). arXiv preprint arXiv:1803.00085, 2018. 

- Liao M, Zhu Z, Shi B, et al. [Rotation-Sensitive Regression for Oriented Scene Text Detection](https://arxiv.org/abs/1803.05265). [C]arXiv preprint arXiv:1803.05265, 2018. 

- Carbonell M, Villegas M, Fornés A, et al. [Joint Recognition of Handwritten Text and Named Entities with a Neural End-to-end Model](https://arxiv.org/abs/1803.06252)[J]. arXiv preprint arXiv:1803.06252, 2018.

- Goswami T, Barad Z, Desai P, et al. [Text Detection and Recognition in images: A survey](https://arxiv.org/abs/1803.07278)[J]. arXiv preprint arXiv:1803.07278, 2018.

- José Carlos Aradillas, Juan José Murillo-Fuentes, Pablo M. Olmos. [Boosting Handwriting Text Recognition in Small Databases with Transfer Learning](https://arxiv.org/abs/1804.01527)[J]. arXiv preprint arXiv: 1803.01527, 2018.

- Linjie Deng, Yanxiang Gong, Yi Lin, Jingwen Shuai, Xiaoguang Tu, Yufei Zhang, Zheng Ma, Mei Xie. [Detecting Multi-Oriented Text with Corner-based Region Proposals](https://arxiv.org/abs/1804.02690)[J]. arXiv preprint arXiv:1804.02690, 2018.

- Partha Pratim Roy, Akash Mohta, Bidyut B. Chaudhuri. [Synthetic data generation for Indic handwritten text recognition](https://arxiv.org/abs/1804.06254)[J]. arXiv preprint arXiv:1804.06254, 2018.

- Dafang He, Yeqing Li, Alexander Gorban, Derrall Heath, Julian Ibarz, Qian Yu, Daniel Kifer, C. Lee Giles. [Guided Attention for Large Scale Scene Text Verification](https://arxiv.org/abs/1804.08588)[J]. arXiv preprint arXiv:1804.08588, 2018.

- Zhuoyao Zhong, Lei Sun, Qiang Huo. [An Anchor-Free Region Proposal Network for Faster R-CNN based Text  Detection Approaches](https://arxiv.org/abs/1804.09003)[J]. arXiv preprint arXiv:1804.09003, 2018.

- 【alibaba】Qiangpeng Yang, Mengli Cheng, Wenmeng Zhou, Yan Chen, Minghui Qiu, Wei Lin, Wei Chu. [IncepText: A New Inception-Text Module with Deformable PSROI Pooling for  Multi-Oriented Scene Text Detection](https://arxiv.org/abs/1805.01167)[J]. arXiv preprint arXiv:1805.01167, 2018.

- Francisco Cruz, Oriol Ramos Terrades. [A probabilistic framework for handwritten text line segmentation](https://arxiv.org/abs/1805.02536)[J]. arXiv preprint arXiv:1805.02536, 2018.

- Fan Bai, Zhanzhan Cheng, Yi Niu, Shiliang Pu, Shuigeng Zhou. [Edit Probability for Scene Text Recognition](https://arxiv.org/abs/1805.03384)[J]. arXiv preprint arXiv:1805.03384, 2018.

- Xiaoyu Yue, Zhanghui Kuang, Zhaoyang Zhang, Zhenfang Chen, Pan He, Yu Qiao, Wei Zhang. [Boosting up Scene Text Detectors with Guided CNN](https://arxiv.org/abs/1805.04132)[J]. arXiv preprint arXiv:1805.04132, 2018.

- Zichuan Liu, Guosheng Lin, Sheng Yang, Jiashi Feng, Weisi Lin, Wang Ling Goh. [Learning Markov Clustering Networks for Scene Text Detection](https://arxiv.org/abs/1805.08365)[J]. arXiv preprint arXiv:1805.08365, 2018.

- Yi-Chao Wu, Fei Yin, Xu-Yao Zhang, Li Liu, Cheng-Lin Liu. [SCAN: Sliding Convolutional Attention Network for Scene Text Recognition](https://arxiv.org/abs/1806.00578)[J]. arXiv preprint arXiv:1806.00578, 2018.

- Fenfen Sheng, Zhineng Chen, Bo Xu. [NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text  Recognition](https://arxiv.org/abs/1806.00926)[J]. arXiv preprint arXiv:1806.00926, 2018.

- 【PSENet】Xiang Li, Wenhai Wang, Wenbo Hou, Ruo-Ze Liu, Tong Lu, Jian Yang. [Shape Robust Text Detection with Progressive Scale Expansion Network](https://arxiv.org/abs/1806.02559)[J]. arXiv preprint arXiv:1806.02559, 2018.

- Sauradip Nag, Pallab Kumar Ganguly, Sumit Roy, Sourab Jha, Krishna Bose, Abhishek Jha, Kousik Dasgupta. [Offline Extraction of Indic Regional Language from Natural Scene Image  using Text Segmentation and Deep Convolutional Sequence](https://arxiv.org/abs/1806.06208)[J]. arXiv preprint arXiv:1806.06208, 2018.

- Arka Ujjal dey, Suman K. Ghosh, Ernest Valveny. [Don't only Feel Read: Using Scene text to understand advertisements](https://arxiv.org/abs/1806.08279)[J]. arXiv preprint arXiv:1806.08279, 2018.

- Shangbang Long, Jiaqiang Ruan, Wenjie Zhang, Xin He, Wenhao Wu, Cong Yao. [TextSnake: A Flexible Representation for Detecting Text of Arbitrary  Shapes](https://arxiv.org/abs/1807.01544)[J]. arXiv preprint arXiv:1807.01544, 2018.

- Qi Yuan, Bingwang Zhang, Haojie Li, Zhihui Wang, Zhongxuan Luo. [A Single Shot Text Detector with Scale-adaptive Anchors](https://arxiv.org/abs/1807.01884)[J]. arXiv preprint arXiv:1807.01884, 2018.

- Pengyuan Lyu, Minghui Liao, Cong Yao, Wenhao Wu, Xiang Bai. [Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting  Text with Arbitrary Shapes](https://arxiv.org/abs/1807.02242)[J]. arXiv preprint arXiv:1807.02242, 2018.

- Fangneng Zhan, Shijian Lu, Chuhui Xue. [Verisimilar Image Synthesis for Accurate Detection and Recognition of  Texts in Scenes](https://arxiv.org/abs/1807.03021)[J]. arXiv preprint arXiv:1807.03021, 2018.

- Xiaoyong Yuan, Pan He, Xiaolin Andy Li. [Adaptive Adversarial Attack on Scene Text Recognition](https://arxiv.org/abs/1807.03326)[J]. arXiv preprint arXiv:1807.03326, 2018.

- Chuhui Xue, Shijian Lu, Fangneng Zhan. [Accurate Scene Text Detection through Border Semantics Awareness and  Bootstrapping](https://arxiv.org/abs/1807.03547)[J]. arXiv preprint arXiv:1807.03547, 2018.

- Arindam Chowdhury, Lovekesh Vig. [An Efficient End-to-End Neural Model for Handwritten Text Recognition](https://arxiv.org/abs/1807.07965)[J]. arXiv preprint arXiv:1807.07965, 2018.

- Yuting Gao, Zheng Huang, Yuchen Dai. [Double Supervised Network with Attention Mechanism for Scene Text  Recognition](https://arxiv.org/abs/1808.00677)[J]. arXiv preprint arXiv:1808.00677, 2018.  

- Wenchao Wang, Jun Du, Zi-Rui Wang. [Parsimonious HMMs for Offline Handwritten Chinese Text Recognition](https://arxiv.org/abs/1808.04138)[J]. arXiv preprint arXiv:1808.04138, 2018.   

- Lluís Gómez, Andrés Mafla, Marçal Rusiñol, DimosthenisKaratzas. [Single Shot Scene Text Retrieval](https://arxiv.org/abs/1808.09044)[J]. arXiv preprint arXiv:1808.09044, 2018.         

- Dafang He, Xiao Yang, Daniel Kifer, C.Lee Giles .[TextContourNet: a Flexible and Effective Framework for Improving Scene Text Detection Architecture with a Multi-task Cascade](https://arxiv.org/pdf/1809.03050) .[J] arXiv preprint arXiv:1809.03050.

- Minghui Liao, Jian Zhang, Zhaoyi Wan, Fengming Xie, Jiajun Liang, Pengyuan Lyu, Cong Yao, Xiang Bai .[Scene Text Recognition from Two-Dimensional Perspective](https://arxiv.org/pdf/1809.06508) .[J] arXiv preprint arXiv:1809.06508.

- Mayank Gupta, Abhinav Kumar, Sriganesh Madhvanath .[Parametric Synthesis of Text on Stylized Backgrounds using PGGANs](https://arxiv.org/pdf/1809.08488) .[J] arXiv preprint arXiv:1809.08488.

- Saad Bin Ahmed, Saeeda Naz, Muhammad Imran Razzak, Rubiyah Yusof .[Cursive Scene Text Analysis by Deep Convolutional Linear Pyramids](https://arxiv.org/pdf/1809.10792) .[J] arXiv preprint arXiv:1809.10792.

- Zichuan Liu, Guosheng Lin, Wang Ling Goh, Fayao Liu, Chunhua Shen, Xiaokang Yang .[Correlation Propagation Networks for Scene Text Detection](https://arxiv.org/pdf/1810.00304) .[J] arXiv preprint arXiv:1810.00304.

- Ahmed Sabir, Francesc Moreno-Noguer, Lluís Padró .[Visual Semantic Re-ranker for Text Spotting](https://arxiv.org/pdf/1810.09776) .[J] arXiv preprint arXiv:1810.09776.

- Ahmed Sabir, Francesc Moreno-Noguer, Lluís Padró .[Visual Re-ranking with Natural Language Understanding for Text Spotting](https://arxiv.org/pdf/1810.12738) .[J] arXiv preprint arXiv:1810.12738.

- Hui Li, Peng Wang, Chunhua Shen, Guyu Zhang .[Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition](https://arxiv.org/pdf/1811.00751) .[J] arXiv preprint arXiv:1811.00751.

- Shangbang Long, Xin He, Cong Ya .[Scene Text Detection and Recognition: The Deep Learning Era](https://arxiv.org/pdf/1811.04256) .[J] arXiv preprint arXiv:1811.04256.

- Jing Huang, Viswanath Sivakumar, Mher Mnatsakanyan, Guan Pang .[Improving Rotated Text Detection with Rotation Region Proposal Networks](https://arxiv.org/pdf/1811.07031) .[J] arXiv preprint arXiv:1811.07031.

- Yuan Li, Yuanjie Yu, Zefeng Li, Yangkun Lin, Meifang Xu, Jiwei Li, Xi Zhou .[Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks](https://arxiv.org/pdf/1811.07432) .[J] arXiv preprint arXiv:1811.07432.

- Wanchen Sui, Qing Zhang, Jun Yang, Wei Chu .[A Novel Integrated Framework for Learning both Text Detection and Recognition](https://arxiv.org/pdf/1811.08611) .[J] arXiv preprint arXiv:1811.08611.

- Zhida Huang, Zhuoyao Zhong, Lei Sun, Qiang Huo .[Mask R-CNN with Pyramid Attention Network for Scene Text Detection](https://arxiv.org/pdf/1811.09058) .[J] arXiv preprint arXiv:1811.09058.

- Dinh NguyenVan, Shijian Lu, Shangxuan Tian, Nizar Ouarti, Mounir Mokhtari .[A pooling based scene text proposal technique for scene text reading in the wild](https://arxiv.org/pdf/1811.10003) .[J] arXiv preprint arXiv:1811.10003.

- Hanh T. M. Tran, Tien Ho-Phuoc .[Deep Laplacian Pyramid Network for Text Images Super-Resolution](https://arxiv.org/pdf/1811.10449) .[J] arXiv preprint arXiv:1811.10449.

- Yixing Zhu, Jun Du .[TextMountain: Accurate Scene Text Detection via Instance Segmentation](https://arxiv.org/pdf/1811.12786) .[J] arXiv preprint arXiv:1811.12786.

- Shuaitao Zhang, Yuliang Liu, Lianwen Jin, Yaoxiong Huang, Songxuan Lai .[EnsNet: Ensconce Text in the Wild](https://arxiv.org/pdf/1812.00723) .[J] arXiv preprint arXiv:1812.00723.

- Yongchao Xu, Yukang Wang, Wei Zhou, Yongpan Wang, Zhibo Yang, Xiang Bai .[TextField: Learning A Deep Direction Field for Irregular Scene Text Detection](https://arxiv.org/pdf/1812.01393) .[J] arXiv preprint arXiv:1812.01393.

- Najoua Rahal, Maroua Tounsi, Adel M. Alimi .[Auto-Encoder-BoF/HMM System for Arabic Text Recognition](https://arxiv.org/pdf/1812.03680) .[J] arXiv preprint arXiv:1812.03680.

- 【Dataset】Masakazu Iwamura .[Advances of Scene Text Datasets](https://arxiv.org/pdf/1812.05219) .[J] arXiv preprint arXiv:1812.05219.

- Fangneng Zhan, Shijian Lu .[ESIR: End-to-end Scene Text Recognition via Iterative Image Rectification](https://arxiv.org/pdf/1812.05824) .[J] arXiv preprint arXiv:1812.05824.

- Shuai Yang, Jiaying Liu, Wenjing Wang, Zongming Guo .[TET-GAN: Text Effects Transfer via Stylization and Destylization](https://arxiv.org/pdf/1812.06384) .[J] arXiv preprint arXiv:1812.06384.

- Chankyu Choi, Youngmin Yoon, Junsu Lee, Junseok Kim .[Simultaneous Recognition of Horizontal and Vertical Text in Natural Images](https://arxiv.org/pdf/1812.07059) .[J] arXiv preprint arXiv:1812.07059.

- Yunze Gao, Yingying Chen, Jinqiao Wang, Zhen Lei, Xiao-Yu Zhang, Hanqing Lu .[Recurrent Calibration Network for Irregular Text Recognition](https://arxiv.org/pdf/1812.07145) .[J] arXiv preprint arXiv:1812.07145.

- Zi-Rui Wang, Jun Du, Jia-Ming Wang .[Writer-Aware CNN for Parsimonious HMM-Based Offline Handwritten Chinese Text Recognition](https://arxiv.org/pdf/1812.09809) .[J] arXiv preprint arXiv:1812.09809.

- Yipeng Sun, Chengquan Zhang, Zuming Huang, Jiaming Liu, Junyu Han, Errui Ding .[TextNet: Irregular Text Reading from Images with an End-to-End Trainable Network](https://arxiv.org/pdf/1812.09900) .[J] arXiv preprint arXiv:1812.09900.

- Mohamed Yousef, Khaled F. Hussain, Usama S. Mohammed .[Accurate, Data-Efficient, Unconstrained Text Recognition with Convolutional Neural Networks](https://arxiv.org/pdf/1812.11894) .[J] arXiv preprint arXiv:1812.11894.

---

### 2019

- Jiaming Liu, Chengquan Zhang, Yipeng Sun, Junyu Han, Errui Ding .[Detecting Text in the Wild with Deep Character Embedding Network](https://arxiv.org/pdf/1901.00363) .[J] arXiv preprint arXiv:1901.00363.

- Chuhui Xue, Shijian Lu, Wei Zhang .[MSR: Multi-Scale Shape Regression for Scene Text Detection](https://arxiv.org/pdf/1901.02596) .[J] arXiv preprint arXiv:1901.02596.

- 【MORAN】Canjie Luo, Lianwen Jin, Zenghui Sun .[A Multi-Object Rectified Attention Network for Scene Text Recognition](https://arxiv.org/pdf/1901.03003) .[J] arXiv preprint arXiv:1901.03003.
[code: [Canjie-Luo/MORAN_v2](https://github.com/Canjie-Luo/MORAN_v2)]

- Wei Liu, Chaofeng Chen, Kwan-Yee K. Wong .[SAFE: Scale Aware Feature Encoder for Scene Text Recognition](https://arxiv.org/pdf/1901.05770) .[J] arXiv preprint arXiv:1901.05770.

- Yanxiang Gong, Linjie Deng, Zheng Ma, Mei Xie .[Generating Text Sequence Images for Recognition](https://arxiv.org/pdf/1901.06782) .[J] arXiv preprint arXiv:1901.06782.

- Fangneng Zhan, Hongyuan Zhu, Shijian Lu .[Scene Text Synthesis for Efficient and Effective Deep Network Training](https://arxiv.org/pdf/1901.09193) .[J] arXiv preprint arXiv:1901.09193.

- Amarnath R, P Nagabhushan .[Text line Segmentation in Compressed Representation of Handwritten Document using Tunneling Algorithm](https://arxiv.org/pdf/1901.11477) .[J] arXiv preprint arXiv:1901.11477.

- Eloi Alonso, Bastien Moysset, Ronaldo Messina .[Adversarial Generation of Handwritten Text Images Conditioned on Sequences](https://arxiv.org/pdf/1903.00277) .[J] arXiv preprint arXiv:1903.00277.

- Prasun Roy, Saumik Bhattacharya, Subhankar Ghosh, Umapada Pal .[STEFANN: Scene Text Editor using Font Adaptive Neural Network](https://arxiv.org/pdf/1903.01192) .[J] arXiv preprint arXiv:1903.01192.

- Zhanzhan Cheng, Jing Lu, Jianwen Xie, Yi Niu, Shiliang Pu, Fei Wu .[Efficient Video Scene Text Spotting: Unifying Detection, Tracking, and Recognition](https://arxiv.org/pdf/1903.03299) .[J] arXiv preprint arXiv:1903.03299.

- Bastien Moysset, Ronaldo Messina .[Manifold Mixup improves text recognition with CTC loss](https://arxiv.org/pdf/1903.04246) .[J] arXiv preprint arXiv:1903.04246.

- Johannes Michael, Roger Labahn, Tobias Grüning, Jochen Zöllner .[Evaluating Sequence-to-Sequence Models for Handwritten Text Recognition](https://arxiv.org/pdf/1903.07377) .[J] arXiv preprint arXiv:1903.07377.

- Zichuan Liu, Guosheng Lin, Sheng Yang, Fayao Liu, Weisi Lin, Wang Ling Goh .[Towards Robust Curve Text Detection with Conditional Spatial Expansion](https://arxiv.org/pdf/1903.08836) .[J] arXiv preprint arXiv:1903.08836.

- Zhao Zhou, Shufan Wu, Shuchen Kong, Yingbin Zheng, Hao Ye, Luhui Chen, Jian Pu .[Curve Text Detection with Local Segmentation Network and Curve Connection](https://arxiv.org/pdf/1903.09837) .[J] arXiv preprint arXiv:1903.09837.

- 【Dataset】Chongsheng Zhang, Guowen Peng, Yuefeng Tao, Feifei Fu, Wei Jiang, George Almpanidis, Ke Chen .[ShopSign: a Diverse Scene Text Dataset of Chinese Shop Signs in Street Views](https://arxiv.org/pdf/1903.10412) .[J] arXiv preprint arXiv:1903.10412.

- Jingchao Liu, Xuebo Liu, Jie Sheng, Ding Liang, Xin Li, Qingjie Liu .[Pyramid Mask Text Detector](https://arxiv.org/pdf/1903.11800) .[J] arXiv preprint arXiv:1903.11800.

- Xiaohui Zhao, Zhuo Wu, Xiaoguang Wang .[CUTIE: Learning to Understand Documents with Convolutional Universal Text Information Extractor](https://arxiv.org/pdf/1903.12363) .[J] arXiv preprint arXiv:1903.12363.

- Wenhai Wang, Enze Xie, Xiang Li, Wenbo Hou, Tong Lu, Gang Yu, Shuai Shao .[Shape Robust Text Detection with Progressive Scale Expansion Network](https://arxiv.org/pdf/1903.12473) .[J] arXiv preprint arXiv:1903.12473.

- Yuliang Liu, Lianwen Jin, Zecheng Xie, Canjie Luo, Shuaitao Zhang, Lele Xie .[Tightness-aware Evaluation Protocol for Scene Text Detection](https://arxiv.org/pdf/1904.00813) .[J] arXiv preprint arXiv:1904.00813.

- 【Dataset】Simone Bonechi, Paolo Andreini, Monica Bianchini, Franco Scarselli .[COCO_TS Dataset: Pixel-level Annotations Based on Weak Supervision for Scene Text Segmentation](https://arxiv.org/pdf/1904.00818) .[J] arXiv preprint arXiv:1904.00818.

- Peng Wang, Lu Yang, Hui Li, Yuyan Deng, Chunhua Shen, Yanning Zhang .[A Simple and Robust Convolutional-Attention Network for Irregular Text Recognition](https://arxiv.org/pdf/1904.01375) .[J] arXiv preprint arXiv:1904.01375.

- Jeonghun Baek, Geewook Kim, Junyeop Lee, Sungrae Park, Dongyoon Han, Sangdoo Yun, Seong Joon Oh, Hwalsuk Lee .[What is wrong with scene text recognition model comparisons? dataset and model analysis](https://arxiv.org/pdf/1904.01906) .[J] arXiv preprint arXiv:1904.01906.

- Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, Hwalsuk Lee .[Character Region Awareness for Text Detection](https://arxiv.org/pdf/1904.01941) .[J] arXiv preprint arXiv:1904.01941.

- Chengquan Zhang, Borong Liang, Zuming Huang, Mengyi En, Junyu Han, Errui Ding, Xinghao Ding .[Look More Than Once: An Accurate Detector for Text of Arbitrary Shapes](https://arxiv.org/pdf/1904.06535) .[J] arXiv preprint arXiv:1904.06535.

- 【Dataset】Vinoj Jayasundara, Sandaru Jayasekara, Hirunima Jayasekara, Jathushan Rajasegaran, Suranga Seneviratne, Ranga Rodrigo .[TextCaps : Handwritten Character Recognition with Very Small Datasets](https://arxiv.org/pdf/1904.08095) .[J] arXiv preprint arXiv:1904.08095.

- R. Reeve Ingle, Yasuhisa Fujii, Thomas Deselaers, Jonathan Baccash, Ashok C. Popat .[A Scalable Handwritten Text Recognition System](https://arxiv.org/pdf/1904.09150) .[J] arXiv preprint arXiv:1904.09150.

- Qingqing Wang, Wenjing Jia, Xiangjian He, Yue Lu, Michael Blumenstein, Ye Huang .[FACLSTM: ConvLSTM with Focused Attention for Scene Text Recognition](https://arxiv.org/pdf/1904.09405) .[J] arXiv preprint arXiv:1904.09405.

- Fady Medhat, Mahnaz Mohammadi, Sardar Jaf, Chris G. Willcocks, Toby P. Breckon, Peter Matthews, Andrew Stephen McGough, Georgios Theodoropoulos, Boguslaw Obara .[TMIXT: A process flow for Transcribing MIXed handwritten and machine-printed Text](https://arxiv.org/pdf/1904.12387) .[J] arXiv preprint arXiv:1904.12387.

- Weijia Wu, Jici Xing, Hong Zhou .[TextCohesion: Detecting Text for Arbitrary Shapes](https://arxiv.org/pdf/1904.12640) .[J] arXiv preprint arXiv:1904.12640.

- Shuai Yang, Zhangyang Wang, Zhaowen Wang, Ning Xu, Jiaying Liu, Zongming Guo .[Controllable Artistic Text Style Transfer via Shape-Matching GAN](https://arxiv.org/pdf/1905.01354) [J]. arXiv preprint arXiv:1905.01354.

- Shuai Yang, Wenjing Wang, Jiaying Liu .[TE141K: Artistic Text Benchmark for Text Effects Transfer](https://arxiv.org/pdf/1905.03646) [J]. arXiv preprint arXiv:1905.03646.

- Danlu Chen, Xu-Yao Zhang, Wei Zhang, Yao Lu, Xiuli Li, Tao Mei .[Predictive Ensemble Learning with Application to Scene Text Detection](https://arxiv.org/pdf/1905.04641) [J]. arXiv preprint arXiv:1905.04641.

- Xiaobing Wang, Yingying Jiang, Zhenbo Luo, Cheng-Lin Liu, Hyunsoo Choi, Sungjin Kim .[Arbitrary Shape Scene Text Detection with Adaptive Text Region Representation](https://arxiv.org/pdf/1905.05980) [J]. arXiv preprint arXiv:1905.05980.

- Arka Ujjal Dey, Suman Kumar Ghosh, Ernest Valveny .[Beyond Visual Semantics: Exploring the Role of Scene Text in Image Understanding](https://arxiv.org/pdf/1905.10622) [J]. arXiv preprint arXiv:1905.10622.

- Ali Furkan Biten, Ruben Tito, Andres Mafla, Lluis Gomez, Marçal Rusiñol, Ernest Valveny, C.V. Jawahar, Dimosthenis Karatzas .[Scene Text Visual Question Answering](https://arxiv.org/pdf/1905.13648) [J]. arXiv preprint arXiv:1905.13648.

- Raul Gomez, Ali Furkan Biten, Lluis Gomez, Jaume Gibert, Marçal Rusiñol, Dimosthenis Karatzas .[Selective Style Transfer for Text](https://arxiv.org/pdf/1906.01466) [J]. arXiv preprint arXiv:1906.01466.

- 【Dataset】Hongyu Li, Fan Zhu, Junhua Qiu .[Towards Document Image Quality Assessment: A Text Line Based Framework and A Synthetic Text Line Image Dataset](https://arxiv.org/pdf/1906.01907) [J]. arXiv preprint arXiv:1906.01907.

- Yuliang Liu, Sheng Zhang, Lianwen Jin, Lele Xie, Yaqiang Wu, Zhepeng Wang .[Omnidirectional Scene Text Detection with Sequential-free Box Discretization](https://arxiv.org/pdf/1906.02371) [J]. arXiv preprint arXiv:1906.02371.

- Junho Jo, Hyung Il Koo, Jae Woong Soh, Nam Ik Cho .[Handwritten Text Segmentation via End-to-End Learning of Convolutional Neural Network](https://arxiv.org/pdf/1906.05229) [J]. arXiv preprint arXiv:1906.05229.

- Pengyuan Lyu, Zhicheng Yang, Xinhang Leng, Xiaojun Wu, Ruiyu Li, Xiaoyong Shen .[2D Attentional Irregular Scene Text Recognizer](https://arxiv.org/pdf/1906.05708) [J]. arXiv preprint arXiv:1906.05708.

- Hui Li, Peng Wang, Chunhua Shen .[Towards End-to-End Text Spotting in Natural Scenes](https://arxiv.org/pdf/1906.06013) [J]. arXiv preprint arXiv:1906.06013.

- Michele Alberti, Lars Vögtlin, Vinaychandran Pondenkandath, Mathias Seuret, Rolf Ingold, Marcus Liwicki .[Labeling, Cutting, Grouping: an Efficient Text Line Segmentation Method for Medieval Manuscripts](https://arxiv.org/pdf/1906.11894) [J]. arXiv preprint arXiv:1906.11894.

- Ali Furkan Biten, Rubèn Tito, Andres Mafla, Lluis Gomez, Marçal Rusiñol, Minesh Mathew, C.V. Jawahar, Ernest Valveny, Dimosthenis Karatzas .[ICDAR 2019 Competition on Scene Text Visual Question Answering](https://arxiv.org/pdf/1907.00490) [J]. arXiv preprint arXiv:1907.00490.

- Toshiki Nakamura, Anna Zhu, Seiichi Uchida .[Scene Text Magnifier](https://arxiv.org/pdf/1907.00693) [J]. arXiv preprint arXiv:1907.00693.

- Nibal Nayef, Yash Patel, Michal Busta, Pinaki Nath Chowdhury, Dimosthenis Karatzas, Wafa Khlif, Jiri Matas, Umapada Pal, Jean-Christophe Burie, Cheng-lin Liu, Jean-Marc Ogier .[ICDAR2019 Robust Reading Challenge on Multi-lingual Scene Text Detection and Recognition -- RRC-MLT-2019](https://arxiv.org/pdf/1907.00945) [J]. arXiv preprint arXiv:1907.00945.

- Chae Young Lee, Youngmin Baek, Hwalsuk Lee .[TedEval: A Fair Evaluation Metric for Scene Text Detectors](https://arxiv.org/pdf/1907.01227) [J]. arXiv preprint arXiv:1907.01227.

- Pranay Dugar, Anirban Chatterjee, Rajesh Shreedhar Bhat, Saswata Sahoo .[Semi-Bagging Based Deep Neural Architecture to Extract Text from High Entropy Images](https://arxiv.org/pdf/1907.01284) [J]. arXiv preprint arXiv:1907.01284.

- Christen M, AB Saravanan .[RFBTD: RFB Text Detector](https://arxiv.org/pdf/1907.02228) [J]. arXiv preprint arXiv:1907.02228.

- Minghui Liao, Boyu Song, Minghang He, Shangbang Long, Cong Yao, Xiang Bai .[SynthText3D: Synthesizing Scene Text Images from 3D Virtual Worlds](https://arxiv.org/pdf/1907.06007) [J]. arXiv preprint arXiv:1907.06007.

- Fangneng Zhan, Chuhui Xue, Shijian Lu .[GA-DAN: Geometry-Aware Domain Adaptation Network for Scene Text Detection and Recognition](https://arxiv.org/pdf/1907.09653) [J]. arXiv preprint arXiv:1907.09653.

- Zhaoyi Wan, Fengming Xie, Yibo Liu, Xiang Bai, Cong Yao .[2D-CTC for Scene Text Recognition](https://arxiv.org/pdf/1907.09705) [J]. arXiv preprint arXiv:1907.09705.

- Bo Ji, Tianyi Chen .[Generative Adversarial Network for Handwritten Text](https://arxiv.org/pdf/1907.11845) [J]. arXiv preprint arXiv:1907.11845.

- Elad Richardson, Yaniv Azar, Or Avioz, Niv Geron, Tomer Ronen, Zach Avraham, Stav Shapiro .[It's All About The Scale -- Efficient Text Detection Using Adaptive Scaling](https://arxiv.org/pdf/1907.12122) [J]. arXiv preprint arXiv:1907.12122.

- Bulla Rajesh, Mohammed Javed, P Nagabhushan .[Automatic Text Line Segmentation Directly in JPEG Compressed Document Images](https://arxiv.org/pdf/1907.12219) [J]. arXiv preprint arXiv:1907.12219.

- Xu Zhenlong, Zhou shuigeng, Cheng zhanzhan, Bai fan, Niu yi, Pu shiliang .[Towards Pure End-to-End Learning for Recognizing Multiple Text Sequences from an Image](https://arxiv.org/pdf/1907.12791) [J]. arXiv preprint arXiv:1907.12791.

- Yi Zheng, Qitong Wang, Margrit Betke .[Deep Neural Network for Semantic-based Text Recognition in Images](https://arxiv.org/pdf/1908.01403) [J]. arXiv preprint arXiv:1908.01403.

- MingKun Yang, Yushuo Guan, Minghui Liao, Xin He, Kaigui Bian, Song Bai, Cong Yao, Xiang Bai .[Symmetry-constrained Rectification Network for Scene Text Recognition](https://arxiv.org/pdf/1908.01957) [J]. arXiv preprint arXiv:1908.01957.

- Liang Wu, Chengquan Zhang, Jiaming Liu, Junyu Han, Jingtuo Liu, Errui Ding, Xiang Bai .[Editing Text in the Wild](https://arxiv.org/pdf/1908.03047) [J]. arXiv preprint arXiv:1908.03047.

- Wenhai Wang, Enze Xie, Xiaoge Song, Yuhang Zang, Wenjia Wang, Tong Lu, Gang Yu, Chunhua Shen .[Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network](https://arxiv.org/pdf/1908.05900) [J]. arXiv preprint arXiv:1908.05900.

- Hongyuan Yu, Chengquan Zhang, Xuan Li, Junyu Han, Errui Ding, Liang Wang .[An End-to-end Video Text Detector with Online Tracking](https://arxiv.org/pdf/1908.07135) [J]. arXiv preprint arXiv:1908.07135.

- Minghui Liao, Pengyuan Lyu, Minghang He, Cong Yao, Wenhao Wu, Xiang Bai .[Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes](https://arxiv.org/pdf/1908.08207) [J]. arXiv preprint arXiv:1908.08207.

- Alexander Filonenko, Konstantin Gudkov, Aleksei Lebedev, Nikita Orlov, Ivan Zagaynov .[FaSTExt: Fast and Small Text Extractor](https://arxiv.org/pdf/1908.08994) [J]. arXiv preprint arXiv:1908.08994.

- Siyang Qin, Alessandro Bissacco, Michalis Raptis, Yasuhisa Fujii, Ying Xiao .[Towards Unconstrained End-to-End Text Spotting](https://arxiv.org/pdf/1908.09231) [J]. arXiv preprint arXiv:1908.09231.

- Xiaoxue Chen, Tianwei Wang, Yuanzhi Zhu, Lianwen Jin, Canjie Luo .[Adaptive Embedding Gate for Attention-Based Scene Text Recognition](https://arxiv.org/pdf/1908.09475) [J]. arXiv preprint arXiv:1908.09475.

- Gundram Leifert, Roger Labahn, Tobias Grüning, Svenja Leifert .[End-To-End Measure for Text Recognition](https://arxiv.org/pdf/1908.09584) [J]. arXiv preprint arXiv:1908.09584.

- Xugong Qin, Yu Zhou, Dongbao Yang, Weiping Wang .[Curved Text Detection in Natural Scene Images with Semi- and Weakly-Supervised Learning](https://arxiv.org/pdf/1908.09990) [J]. arXiv preprint arXiv:1908.09990.

- Yanxiang Gong, Linjie Deng, Xinchen Lu, Xin Yi, Zheng Ma, Mei Xie .[Focus-Enhanced Scene Text Recognition with Deformable Convolutions](https://arxiv.org/pdf/1908.10998) [J]. arXiv preprint arXiv:1908.10998.

- Shangbang Long, Yushuo Guan, Bingxuan Wang, Kaigui Bian, Cong Yao .[Alchemy: Techniques for Rectification Based Irregular Scene Text Recognition](https://arxiv.org/pdf/1908.11834) [J]. arXiv preprint arXiv:1908.11834.

- Youjiang Xu, Jiaqi Duan, Zhanghui Kuang, Xiaoyu Yue, Hongbin Sun, Yue Guan, Wayne Zhang .[Geometry Normalization Networks for Accurate Scene Text Detection](https://arxiv.org/pdf/1909.00794) [J]. arXiv preprint arXiv:1909.00794.

- Wenjia Wang, Enze Xie, Peize Sun, Wenhai Wang, Lixun Tian, Chunhua Shen, Ping Luo .[TextSR: Content-Aware Text Super-Resolution Guided by Recognition](https://arxiv.org/pdf/1909.07113) [J]. arXiv preprint arXiv:1909.07113.

- Chee-Kheng Chng, Yuliang Liu, Yipeng Sun, Chun Chet Ng, Canjie Luo, Zihan Ni, ChuanMing Fang, Shuaitao Zhang, Junyu Han, Errui Ding, Jingtuo Liu, Dimosthenis Karatzas, Chee Seng Chan, Lianwen Jin .[ICDAR2019 Robust Reading Challenge on Arbitrary-Shaped Text (RRC-ArT)](https://arxiv.org/pdf/1909.07145) [J]. arXiv preprint arXiv:1909.07145.

- Linjie Deng, Yanxiang Gong, Xinchen Lu, Yi Lin, Zheng Ma, Mei Xie .[STELA: A Real-Time Scene Text Detector with Learned Anchor](https://arxiv.org/pdf/1909.07549) [J]. arXiv preprint arXiv:1909.07549.

- Yipeng Sun, Zihan Ni, Chee-Kheng Chng, Yuliang Liu, Canjie Luo, Chun Chet Ng, Junyu Han, Errui Ding, Jingtuo Liu, Dimosthenis Karatzas, Chee Seng Chan, Lianwen Jin .[ICDAR 2019 Competition on Large-scale Street View Text with Partial Labeling -- RRC-LSVT](https://arxiv.org/pdf/1909.07741) [J]. arXiv preprint arXiv:1909.07741.

- Yipeng Sun, Jiaming Liu, Wei Liu, Junyu Han, Errui Ding, Jingtuo Liu .[Chinese Street View Text: Large-scale Chinese Text Reading with Partially Supervised Learning](https://arxiv.org/pdf/1909.07808) [J]. arXiv preprint arXiv:1909.07808.

- Han Xu, Yao Ma, Haochen Liu, Debayan Deb, Hui Liu, Jiliang Tang, Anil K. Jain .[Adversarial Attacks and Defenses in Images, Graphs and Text: A Review](https://arxiv.org/pdf/1909.08072) [J]. arXiv preprint arXiv:1909.08072.

- He guo, Xiameng Qin, Jiaming Liu, Junyu Han, Jingtuo Liu, Errui Ding .[EATEN: Entity-aware Attention for Single Shot Visual Text Extraction](https://arxiv.org/pdf/1909.09380) [J]. arXiv preprint arXiv:1909.09380.

- Ning Lu, Wenwen Yu, Xianbiao Qi, Yihao Chen, Ping Gong, Rong Xiao .[MASTER: Multi-Aspect Non-local Network for Scene Text Recognition](https://arxiv.org/pdf/1910.02562) [J]. arXiv preprint arXiv:1910.02562.

- Konstantin Bulatov, Boris Savelyev, Vladimir V. Arlazarov .[Next integrated result modelling for stopping the text field recognition process in a video using a result model with per-character alternatives](https://arxiv.org/pdf/1910.04107) [J]. arXiv preprint arXiv:1910.04107.

- Junyeop Lee, Sungrae Park, Jeonghun Baek, Seong Joon Oh, Seonghyeon Kim, Hwalsuk Lee .[On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention](https://arxiv.org/pdf/1910.04396) [J]. arXiv preprint arXiv:1910.04396.

- Fedor Borisyuk, Albert Gordo, Viswanath Sivakumar .[Rosetta: Large scale system for text detection and recognition in images](https://arxiv.org/pdf/1910.05085) [J]. arXiv preprint arXiv:1910.05085.

- Mostafa Karimi, Gopalkrishna Veni, Yen-Yun Yu .[Illegible Text to Readable Text: An Image-to-Image Transformation using Conditional Sliced Wasserstein Adversarial Networks](https://arxiv.org/pdf/1910.05425) [J]. arXiv preprint arXiv:1910.05425.

- Hannes Fassold, Ridouane Ghermi .[OmniTrack: Real-time detection and tracking of objects, text and logos in video](https://arxiv.org/pdf/1910.06017) [J]. arXiv preprint arXiv:1910.06017.

- W. Ronny Huang, Yike Qi, Qianqian Li, Jonathan Degange .[DeepErase: Weakly Supervised Ink Artifact Removal in Document Text Images](https://arxiv.org/pdf/1910.07070) [J]. arXiv preprint arXiv:1910.07070.

- Xiangcheng Du, Tianlong Ma, Yingbin Zheng, Hao Ye, Xingjiao Wu, Liang He .[Scene Text Recognition with Temporal Convolutional Encoder](https://arxiv.org/pdf/1911.01051) [J]. arXiv preprint arXiv:1911.01051.

- Duc Nguyen, Nhan Tran, Hung Le .[Improving Long Handwritten Text Line Recognition with Convolutional Multi-way Associative Memory](https://arxiv.org/pdf/1911.01577) [J]. arXiv preprint arXiv:1911.01577.

- Qitong Wang, Yi Zheng, Margrit Betke .[SA-Text: Simple but Accurate Detector for Text of Arbitrary Shapes](https://arxiv.org/pdf/1911.07046) [J]. arXiv preprint arXiv:1911.07046.

- XiaoQian Li, Jie Liu, ShuWu Zhang, GuiXuan Zhang .[Learning to Predict More Accurate Text Instances for Scene Text Detection](https://arxiv.org/pdf/1911.07423) [J]. arXiv preprint arXiv:1911.07423.

- Christian Bartz, Joseph Bethge, Haojin Yang, Christoph Meinel .[KISS: Keeping It Simple for Scene Text Recognition](https://arxiv.org/pdf/1911.08400) [J]. arXiv preprint arXiv:1911.08400.

- Minghui Liao, Zhaoyi Wan, Cong Yao, Kai Chen, Xiang Bai .[Real-time Scene Text Detection with Differentiable Binarization](https://arxiv.org/pdf/1911.08947) [J]. arXiv preprint arXiv:1911.08947.

- Simone Bonechi, Paolo Andreini, Monica Bianchini, Franco Scarselli .[Weak Supervision for Generating Pixel-Level Annotations in Scene Text Segmentation](https://arxiv.org/pdf/1911.09026) [J]. arXiv preprint arXiv:1911.09026.

- Hao Wang, Pu Lu, Hui Zhang, Mingkun Yang, Xiang Bai, Yongchao Xu, Mengchao He, Yongpan Wang, Wenyu Liu .[All You Need Is Boundary: Toward Arbitrary-Shaped Text Spotting](https://arxiv.org/pdf/1911.09550) [J]. arXiv preprint arXiv:1911.09550.

- Olga Petrova, Konstantin Bulatov, Vladimir L. Arlazarov .[Methods of Weighted Combination for Text Field Recognition in a Video Stream](https://arxiv.org/pdf/1911.12028) [J]. arXiv preprint arXiv:1911.12028.

- Maurits Bleeker, Maarten de Rijke .[Bidirectional Scene Text Recognition with a Single Decoder](https://arxiv.org/pdf/1912.03656) [J]. arXiv preprint arXiv:1912.03656.

- Changxu Cheng, Qiuhui Huang, Xiang Bai, Bin Feng, Wenyu Liu .[Patch Aggregator for Scene Text Script Identification](https://arxiv.org/pdf/1912.03818) [J]. arXiv preprint arXiv:1912.03818.

- Jinjin Zhang, Wei Wang, Di Huang, Qingjie Liu, Yunhong Wang .[A Feasible Framework for Arbitrary-Shaped Scene Text Recognition](https://arxiv.org/pdf/1912.04561) [J]. arXiv preprint arXiv:1912.04561.

- Boying Li, Danping Zou, Daniele Sartori, Ling Pei, Wenxian Yu .[TextSLAM: Visual SLAM with Planar Text Features](https://arxiv.org/pdf/1912.05002) [J]. arXiv preprint arXiv:1912.05002.

- Lambert Schomaker .[Lifelong learning for text retrieval and recognition in historical handwritten document collections](https://arxiv.org/pdf/1912.05156) [J]. arXiv preprint arXiv:1912.05156.

- Zhao Zhang, Zemin Tang, Zheng Zhang, Yang Wang, Jie Qin, Meng Wang .[Fully-Convolutional Intensive Feature Flow Neural Network for Text Recognition](https://arxiv.org/pdf/1912.06446) [J]. arXiv preprint arXiv:1912.06446.

- Zhao Zhang, Zemin Tang, Yang Wang, Zheng Zhang, Shuicheng Yan, Meng Wang .[Fast DenseNet: Towards Efficient and Accurate Text Recognition with Fast Dense Networks](https://arxiv.org/pdf/1912.07016) [J]. arXiv preprint arXiv:1912.07016.

- Osman Tursun, Simon Denman, Rui Zeng, Sabesan Sivapalan, Sridha Sridharan, Clinton Fookes .[MTRNet++: One-stage Mask-based Scene Text Eraser](https://arxiv.org/pdf/1912.07183) [J]. arXiv preprint arXiv:1912.07183.

- Zi-Rui Wang, Jun Du .[Joint Architecture and Knowledge Distillation in Convolutional Neural Network for Offline Handwritten Chinese Text Recognition](https://arxiv.org/pdf/1912.07806) [J]. arXiv preprint arXiv:1912.07806.

- Joël Seytre, Jon Wu, Alessandro Achille .[TextTubes for Detecting Curved Text in the Wild](https://arxiv.org/pdf/1912.08990) [J]. arXiv preprint arXiv:1912.08990.

- Yuliang Liu, Tong He, Hao Chen, Xinyu Wang, Canjie Luo, Shuaitao Zhang, Chunhua Shen, Lianwen Jin .[Exploring the Capacity of Sequential-free Box Discretization Network for Omnidirectional Scene Text Detection](https://arxiv.org/pdf/1912.09629) [J]. arXiv preprint arXiv:1912.09629.

- Xi Liu, Rui Zhang, Yongsheng Zhou, Qianyi Jiang, Qi Song, Nan Li, Kai Zhou, Lei Wang, Dong Wang, Minghui Liao, Mingkun Yang, Xiang Bai, Baoguang Shi, Dimosthenis Karatzas, Shijian Lu, C. V. Jawahar .[ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboard](https://arxiv.org/pdf/1912.09641) [J]. arXiv preprint arXiv:1912.09641.

- Manuel Carbonell, Alicia Fornés, Mauricio Villegas, Josep Lladós .[TreyNet: A Neural Model for Text Localization, Transcription and Named Entity Recognition in Full Pages](https://arxiv.org/pdf/1912.10016) [J]. arXiv preprint arXiv:1912.10016.

- Tianwei Wang, Yuanzhi Zhu, Lianwen Jin, Canjie Luo, Xiaoxue Chen, Yaqiang Wu, Qianying Wang, Mingxiang Cai .[Decoupled Attention Network for Text Recognition](https://arxiv.org/pdf/1912.10205) [J]. arXiv preprint arXiv:1912.10205.

- Zhaoyi Wan, Minghang He, Haoran Chen, Xiang Bai, Cong Yao .[TextScanner: Reading Characters in Order for Robust Scene Text Recognition](https://arxiv.org/pdf/1912.12422) [J]. arXiv preprint arXiv:1912.12422.

---

### 2020

- Pei Xu, Shan Huang, Hongzhen Wang, Hao Song, Shen Huang, Qi Ju .[A Multi-oriented Chinese Keyword Spotter Guided by Text Line Detection](https://arxiv.org/pdf/2001.00722) [J]. arXiv preprint arXiv:2001.00722.

- Canjie Luo, Qingxiang Lin, Yuliang Liu, Lianwen Jin, Chunhua Shen .[Separating Content from Style Using Adversarial Learning for Recognizing Text in the Wild](https://arxiv.org/pdf/2001.04189) [J]. arXiv preprint arXiv:2001.04189.

- Mayank Wadhwani, Debapriya Kundu, Deepayan Chakraborty, Bhabatosh Chanda .[Text Extraction and Restoration of Old Handwritten Documents](https://arxiv.org/pdf/2001.08742) [J]. arXiv preprint arXiv:2001.08742.

- Zhao Zhang, Zemin Tang, Yang Wang, Jie Qin, Haijun Zhang, Shuicheng Yan .[Fast Dense Residual Network: Enhancing Global Dense Feature Flow for Text Recognition](https://arxiv.org/pdf/2001.09021) [J]. arXiv preprint arXiv:2001.09021.

- Gang Wang .[Scene Text Recognition With Finer Grid Rectification](https://arxiv.org/pdf/2001.09389) [J]. arXiv preprint arXiv:2001.09389.

- Wenyang Hu, Xiaocong Cai, Jun Hou, Shuai Yi, Zhiping Lin .[GTC: Guided Training of CTC Towards Efficient and Accurate Scene Text Recognition](https://arxiv.org/pdf/2002.01276) [J]. arXiv preprint arXiv:2002.01276.

- Shangbang Long, Yushuo Guan, Kaigui Bian, Cong Yao .[A New Perspective for Flexible Feature Gathering in Scene Text Recognition Via Character Anchor Pooling](https://arxiv.org/pdf/2002.03509) [J]. arXiv preprint arXiv:2002.03509.

- Kinjal Dasgupta, Sudip Das, Ujjwal Bhattacharya .[Scale-Invariant Multi-Oriented Text Detection in Wild Scene Images](https://arxiv.org/pdf/2002.06423) [J]. arXiv preprint arXiv:2002.06423.

- Liang Qiao, Sanli Tang, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu .[Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting](https://arxiv.org/pdf/2002.06820) [J]. arXiv preprint arXiv:2002.06820.

- Yuliang Liu, Hao Chen, Chunhua Shen, Tong He, Lianwen Jin, Liangwei Wang .[ABCNet: Real-time Scene Text Spotting with Adaptive Bezier-Curve Network](https://arxiv.org/pdf/2002.10200) [J]. arXiv preprint arXiv:2002.10200.

- Jinyuan Zhao, Yanna Wang, Baihua Xiao, Cunzhao Shi, Fuxi Jia, Chunheng Wang .[DGST : Discriminator Guided Scene Text detector](https://arxiv.org/pdf/2002.12509) [J]. arXiv preprint arXiv:2002.12509.

- Hui Zhang, Quanming Yao, Mingkun Yang, Yongchao Xu, Xiang Bai .[Efficient Backbone Search for Scene Text Recognition](https://arxiv.org/pdf/2003.06567) [J]. arXiv preprint arXiv:2003.06567.

- Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Yongpan Wang .[Learn to Augment: Joint Data Augmentation and Network Optimization for Text Recognition](https://arxiv.org/pdf/2003.06606) [J]. arXiv preprint arXiv:2003.06606.

- Chixiang Ma, Lei Sun, Zhuoyao Zhong, Qiang Huo .[ReLaText: Exploiting Visual Relationships for Arbitrary-Shaped Scene Text Detection with Graph Convolutional Networks](https://arxiv.org/pdf/2003.06999) [J]. arXiv preprint arXiv:2003.06999.

- Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chang Liu, Chun Yang, Hongfa Wang, Xu-Cheng Yin .[Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection](https://arxiv.org/pdf/2003.07493) [J]. arXiv preprint arXiv:2003.07493.

- Xinjie Feng, Hongxun Yao, Yuankai Qi, Jun Zhang, Shengping Zhang .[Scene Text Recognition via Transformer](https://arxiv.org/pdf/2003.08077) [J]. arXiv preprint arXiv:2003.08077.

- Qiangpeng Yang, Hongsheng Jin, Jun Huang, Wei Lin .[SwapText: Image Based Texts Transfer in Scenes](https://arxiv.org/pdf/2003.08152) [J]. arXiv preprint arXiv:2003.08152.

- Berat Kurar Barakat, Ahmad Droby, Rym Alasam, Boraq Madi, Irina Rabaev, Raed Shammes, Jihad El-Sana .[Unsupervised text line segmentation](https://arxiv.org/pdf/2003.08632) [J]. arXiv preprint arXiv:2003.08632.

- Sharon Fogel (1), Hadar Averbuch-Elor (2), Sarel Cohen, Shai Mazor (1), Roee Litman (1) ((1) Amazon Rekognition Israel, (2) Cornell University) .[ScrabbleGAN: Semi-Supervised Varying Length Handwritten Text Generation](https://arxiv.org/pdf/2003.10557) [J]. arXiv preprint arXiv:2003.10557.

- Shangbang Long, Cong Yao .[UnrealText: Synthesizing Realistic Scene Text Images from the Unreal World](https://arxiv.org/pdf/2003.10608) [J]. arXiv preprint arXiv:2003.10608.

- Deli Yu, Xuan Li, Chengquan Zhang, Junyu Han, Jingtuo Liu, Errui Ding .[Towards Accurate Scene Text Recognition with Semantic Reasoning Networks](https://arxiv.org/pdf/2003.12294) [J]. arXiv preprint arXiv:2003.12294.

- Qi Song, Qianyi Jiang, Nan Li, Rui Zhang, Xiaolin Wei .[ReADS: A Rectified Attentional Double Supervised Network for Scene Text Recognition](https://arxiv.org/pdf/2004.02070) [J]. arXiv preprint arXiv:2004.02070.

- Yuxin Wang, Hongtao Xie, Zhengjun Zha, Mengting Xing, Zilong Fu, Yongdong Zhang .[ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene Text Detection](https://arxiv.org/pdf/2004.04940) [J]. arXiv preprint arXiv:2004.04940.

- Ebin Zacharias, Martin Teuchler, Bénédicte Bernier .[Image Processing Based Scene-Text Detection and Recognition with Tesseract](https://arxiv.org/pdf/2004.08079) [J]. arXiv preprint arXiv:2004.08079.

- Zengyuan Guo, Zilin Wang, Zhihui Wang, Wanli Ouyang, Haojie Li, Wen Gao .[Location-Aware Feature Selection for Scene Text Detection](https://arxiv.org/pdf/2004.10999) [J]. arXiv preprint arXiv:2004.10999.

- Meng Cao, Yuexian Zou .[All you need is a second look: Towards Tighter Arbitrary shape text detection](https://arxiv.org/pdf/2004.12436) [J]. arXiv preprint arXiv:2004.12436.

- Wenjia Wang, Enze Xie, Xuebo Liu, Wenhai Wang, Ding Liang, Chunhua Shen, Xiang Bai .[Scene Text Image Super-Resolution in the Wild](https://arxiv.org/pdf/2005.03341) [J]. arXiv preprint arXiv:2005.03341.

- Xiaoxue Chen, Lianwen Jin, Yuanzhi Zhu, Canjie Luo, Tianwei Wang .[Text Recognition in the Wild: A Survey](https://arxiv.org/pdf/2005.03492) [J]. arXiv preprint arXiv:2005.03492.

- Zhaoyi Wan, Jielei Zhang, Liang Zhang, Jiebo Luo, Cong Yao .[On Vocabulary Reliance in Scene Text Recognition](https://arxiv.org/pdf/2005.03959) [J]. arXiv preprint arXiv:2005.03959.

- Atique Ur Rehman, Sibt Ul Hussain .[Large Scale Font Independent Urdu Text Recognition System](https://arxiv.org/pdf/2005.06752) [J]. arXiv preprint arXiv:2005.06752.

- 【Dataset】Sangeeth Reddy, Minesh Mathew, Lluis Gomez, Marcal Rusinol, Dimosthenis Karatzas., C.V. Jawahar .[RoadText-1K: Text Detection & Recognition Dataset for Driving Videos](https://arxiv.org/pdf/2005.09496) [J]. arXiv preprint arXiv:2005.09496.

- Zhi Qiao, Yu Zhou, Dongbao Yang, Yucan Zhou, Weiping Wang .[SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition](https://arxiv.org/pdf/2005.10977) [J]. arXiv preprint arXiv:2005.10977.

- Yudi Chen, Wei Wang, Yu Zhou, Fei Yang, Dongbao Yang, Weiping Wang .[Self-Training for Domain Adaptive Scene Text Detection](https://arxiv.org/pdf/2005.11487) [J]. arXiv preprint arXiv:2005.11487.

- Mayank Kumar Singh, Sayan Banerjee, Shubhasis Chaudhuri .[NENET: An Edge Learnable Network for Link Prediction in Scene Text](https://arxiv.org/pdf/2005.12147) [J]. arXiv preprint arXiv:2005.12147.

- Sihwan Kim, Taejang Park .[Learning Robust Feature Representations for Scene Text Detection](https://arxiv.org/pdf/2005.12466) [J]. arXiv preprint arXiv:2005.12466.

- Sauradip Nag, Palaiahnakote Shivakumara, Umapada Pal, Tong Lu, Michael Blumenstein .[A New Unified Method for Detecting Text from Marathon Runners and Sports Players in Video](https://arxiv.org/pdf/2005.12524) [J]. arXiv preprint arXiv:2005.12524.

- Lei Kang, Pau Riba, Marçal Rusiñol, Alicia Fornés, Mauricio Villegas .[Pay Attention to What You Read: Non-recurrent Handwritten Text-Line Recognition](https://arxiv.org/pdf/2005.13044) [J]. arXiv preprint arXiv:2005.13044.

- Chengwei Zhang, Yunlu Xu, Zhanzhan Cheng, Shiliang Pu, Yi Niu, Fei Wu, Futai Zou .[SPIN: Structure-Preserving Inner Offset Network for Scene Text Recognition](https://arxiv.org/pdf/2005.13117) [J]. arXiv preprint arXiv:2005.13117.

- Peng Zhang, Yunlu Xu, Zhanzhan Cheng, Shiliang Pu, Jing Lu, Liang Qiao, Yi Niu, Fei Wu .[TRIE: End-to-End Text Reading and Information Extraction for Document Understanding](https://arxiv.org/pdf/2005.13118) [J]. arXiv preprint arXiv:2005.13118.

- Arseny Nerinovsky, Igor Buzhinsky, Andey Filchencov .[Realistic text replacement with non-uniform style conditioning](https://arxiv.org/pdf/2006.04170) [J]. arXiv preprint arXiv:2006.04170.

- Zobeir Raisi, Mohamed A. Naiel, Paul Fieguth, Steven Wardell, John Zelek .[Text Detection and Recognition in the Wild: A Review](https://arxiv.org/pdf/2006.04305) [J]. arXiv preprint arXiv:2006.04305.

- Youngmin Baek, Daehyun Nam, Sungrae Park, Junyeop Lee, Seung Shin, Jeonghun Baek, Chae Young Lee, Hwalsuk Lee .[CLEval: Character-Level Evaluation for Text Detection and Recognition Tasks](https://arxiv.org/pdf/2006.06244) [J]. arXiv preprint arXiv:2006.06244.

- Mohamed Yousef, Tom E. Bishop .[OrigamiNet: Weakly-Supervised, Segmentation-Free, One-Step, Full Page Text Recognition by learning to unfold](https://arxiv.org/pdf/2006.07491) [J]. arXiv preprint arXiv:2006.07491.

- Shota Sakaguchi, Jun Kato, Masataka Goto, Seiichi Uchida .[Lyric Video Analysis Using Text Detection and Tracking](https://arxiv.org/pdf/2006.11933) [J]. arXiv preprint arXiv:2006.11933.

- Jinghuang Lin, Zhanzhan Cheng, Fan Bai, Yi Niu, Shiliang Pu, Shuigeng Zhou .[Text Recognition in Real Scenarios with a Few Labeled Samples](https://arxiv.org/pdf/2006.12209) [J]. arXiv preprint arXiv:2006.12209.

- Riku Anegawa, Masayoshi Aritsugi .[Text Detection on Roughly Placed Books by Leveraging a Learning-based Model Trained with Another Domain Data](https://arxiv.org/pdf/2006.14808) [J]. arXiv preprint arXiv:2006.14808.

- Sahar Siddiqui, Elena Sizikova, Gemma Roig, Najib J. Majaj, Denis G. Pelli .[Using Human Psychophysics to Evaluate Generalization in Scene Text Recognition Models](https://arxiv.org/pdf/2007.00083) [J]. arXiv preprint arXiv:2007.00083.

- Siddhant Bansal, Praveen Krishnan, C.V. Jawahar .[Fused Text Recogniser and Deep Embeddings Improve Word Recognition and Retrieval](https://arxiv.org/pdf/2007.00166) [J]. arXiv preprint arXiv:2007.00166.

- Thiago M. Paixão, Rodrigo F. Berriel, Maria C. S. Boeres, Alessandro L. Koerich, Claudine Badue, Alberto F. de Souza, Thiago Oliveira-Santos .[Self-supervised Deep Reconstruction of Mixed Strip-shredded Text Documents](https://arxiv.org/pdf/2007.00779) [J]. arXiv preprint arXiv:2007.00779.

- Klára Janoušková, Jiri Matas, Lluis Gomez, Dimosthenis Karatzas .[Text Recognition -- Real World Data and Where to Find Them](https://arxiv.org/pdf/2007.03098) [J]. arXiv preprint arXiv:2007.03098.

- Changxu Cheng, Wuheng Xu, Xiang Bai, Bin Feng, Wenyu Liu .[Maximum Entropy Regularization and Chinese Text Recognition](https://arxiv.org/pdf/2007.04651) [J]. arXiv preprint arXiv:2007.04651.

- Xugong Qin, Yu Zhou, Dayan Wu, Yinliang Yue, Weiping Wang .[FC2RN: A Fully Convolutional Corner Refinement Network for Accurate Multi-Oriented Scene Text Detection](https://arxiv.org/pdf/2007.05113) [J]. arXiv preprint arXiv:2007.05113.

- Hanchi Ren, Jingjing Deng, Xianghua Xie .[Privacy Preserving Text Recognition with Gradient-Boosting for Federated Learning](https://arxiv.org/pdf/2007.07296) [J]. arXiv preprint arXiv:2007.07296.

- Xiaoyu Yue, Zhanghui Kuang, Chenhao Lin, Hongbin Sun, Wayne Zhang .[RobustScanner: Dynamically Enhancing Positional Clues for Robust Text Recognition](https://arxiv.org/pdf/2007.07542) [J]. arXiv preprint arXiv:2007.07542.

- Minghui Liao, Guan Pang, Jing Huang, Tal Hassner, Xiang Bai .[Mask TextSpotter v3: Segmentation Proposal Network for Robust Scene Text Spotting](https://arxiv.org/pdf/2007.09482) [J]. arXiv preprint arXiv:2007.09482.

- Youngmin Baek, Seung Shin, Jeonghun Baek, Sungrae Park, Junyeop Lee, Daehyun Nam, Hwalsuk Lee .[Character Region Attention For Text Spotting](https://arxiv.org/pdf/2007.09629) [J]. arXiv preprint arXiv:2007.09629.

- Wenqing Zhang, Yang Qiu, Song Bai, Rui Zhang, Xiaolin Wei, Xiang Bai .[FedOCR: Communication-Efficient Federated Learning for Scene Text Recognition](https://arxiv.org/pdf/2007.11462) [J]. arXiv preprint arXiv:2007.11462.

- Wenhai Wang, Xuebo Liu, Xiaozhong Ji, Enze Xie, Ding Liang, Zhibo Yang, Tong Lu, Chunhua Shen, Ping Luo .[AE TextSpotter: Learning Visual and Linguistic Representation for Ambiguous Text Spotting](https://arxiv.org/pdf/2008.00714) [J]. arXiv preprint arXiv:2008.00714.

- Konstantin Bulatov, Nadezhda Fedotova, Vladimir V. Arlazarov .[Fast Approximate Modelling of the Next Combination Result for Stopping the Text Recognition in a Video](https://arxiv.org/pdf/2008.02566) [J]. arXiv preprint arXiv:2008.02566.

- Fangfang Wang, Yifeng Chen, Fei Wu, Xi Li .[TextRay: Contour-based Geometric Modeling for Arbitrary-shaped Scene Text Detection](https://arxiv.org/pdf/2008.04851) [J]. arXiv preprint arXiv:2008.04851.

- Abdelrahman Abdallah, Mohamed Hamada, Daniyar Nurseitov .[Attention-based Fully Gated CNN-BGRU for Russian Handwritten Text](https://arxiv.org/pdf/2008.05373) [J]. arXiv preprint arXiv:2008.05373.

- Kartik Chaudhary, Raghav Bali .[EASTER: Efficient and Scalable Text Recognizer](https://arxiv.org/pdf/2008.07839) [J]. arXiv preprint arXiv:2008.07839.

- Anna Zhu, Hang Du, Shengwu Xiong .[Scene Text Detection with Selected Anchor](https://arxiv.org/pdf/2008.08523) [J]. arXiv preprint arXiv:2008.08523.

- Shengjun Liu, Ningkang Jiang, Yuanbin Wu .[Visual Attack and Defense on Text](https://arxiv.org/pdf/2008.10356) [J]. arXiv preprint arXiv:2008.10356.

- Chenhan Zhang .[Complicating the Social Networks for Better Storytelling: An Empirical Study of Chinese Historical Text and Novel](https://arxiv.org/pdf/2008.10835) [J]. arXiv preprint arXiv:2008.10835.

- Chunhui Li, Xingshu Chen, Haizhou Wang, Yu Zhang, Peiming Wang .[An End-to-End Attack on Text-based CAPTCHAs Based on Cycle-Consistent Generative Adversarial Network](https://arxiv.org/pdf/2008.11603) [J]. arXiv preprint arXiv:2008.11603.

- Brian Davis, Chris Tensmeyer, Brian Price, Curtis Wigington, Bryan Morse, Rajiv Jain .[Text and Style Conditioned GAN for Generation of Offline Handwriting Lines](https://arxiv.org/pdf/2009.00678) [J]. arXiv preprint arXiv:2009.00678.

- Weijia Wu, Ning Lu, Enze Xie .[Synthetic-to-Real Unsupervised Domain Adaptation for Scene Text Detection in the Wild](https://arxiv.org/pdf/2009.01766) [J]. arXiv preprint arXiv:2009.01766.

- Mohammad Fasha, Bassam Hammo, Nadim Obeid, Jabir Widian .[A Hybrid Deep Learning Model for Arabic Text Recognition](https://arxiv.org/pdf/2009.01987) [J]. arXiv preprint arXiv:2009.01987.

- 【Dataset】Julián Del Gobbo, Rosana Matuk Herrera .[Unconstrained Text Detection in Manga: a New Dataset and Baseline](https://arxiv.org/pdf/2009.04042) [J]. arXiv preprint arXiv:2009.04042.

- Hung Tuan Nguyen, Cuong Tuan Nguyen, Takeya Ino, Bipin Indurkhya, Masaki Nakagawa .[Text-independent writer identification using convolutional neural network](https://arxiv.org/pdf/2009.04877) [J]. arXiv preprint arXiv:2009.04877.

- Chuhan Zhang, Ankush Gupta, Andrew Zisserman .[Adaptive Text Recognition through Visual Matching](https://arxiv.org/pdf/2009.06610) [J]. arXiv preprint arXiv:2009.06610.

- Pawan Kumar Singh, Iman Chatterjee, Ram Sarkar, Mita Nasipuri .[Handwritten Script Identification from Text Lines](https://arxiv.org/pdf/2009.07433) [J]. arXiv preprint arXiv:2009.07433.

- Yizhi Wang, Zhouhui Lian .[Exploring Font-independent Features for Scene Text Recognition](https://arxiv.org/pdf/2009.07447) [J]. arXiv preprint arXiv:2009.07447.

- Andres Mafla, Sounak Dey, Ali Furkan Biten, Lluis Gomez, Dimosthenis Karatzas .[Multi-Modal Reasoning Graph for Scene-Text Based Fine-Grained Image Classification and Retrieval](https://arxiv.org/pdf/2009.09809) [J]. arXiv preprint arXiv:2009.09809.

- Bingcong Li, Xin Tang, Xianbiao Qi, Yihao Chen, Rong Xiao .[Hamming OCR: A Locality Sensitive Hashing Neural Network for Scene Text Recognition](https://arxiv.org/pdf/2009.10874) [J]. arXiv preprint arXiv:2009.10874.

- Jianqi Ma .[RRPN++: Guidance Towards More Accurate Scene Text Detection](https://arxiv.org/pdf/2009.13118) [J]. arXiv preprint arXiv:2009.13118.

- Julián Del Gobbo, Rosana Matuk Herrera .[Unconstrained Text Detection in Manga](https://arxiv.org/pdf/2010.03997) [J]. arXiv preprint arXiv:2010.03997.

- Shao Wei Wang, Guan Jie Huang, Xiang Yu Luo .[A Human Eye-based Text Color Scheme Generation Method for Image Synthesis](https://arxiv.org/pdf/2010.07510) [J]. arXiv preprint arXiv:2010.07510.

- Zhi Qiao, Xugong Qin, Yu Zhou, Fei Yang, Weiping Wang .[Gaussian Constrained Attention Network for Scene Text Recognition](https://arxiv.org/pdf/2010.09169) [J]. arXiv preprint arXiv:2010.09169.

- Dongyoung Kim, Myungsung Kwak, Eunji Won, Sejung Shin, Jeongyeon Nam .[TLGAN: document Text Localization using Generative Adversarial Nets](https://arxiv.org/pdf/2010.11547) [J]. arXiv preprint arXiv:2010.11547.

- Shuonan Pei, Mingzhi Zhu .[Real-Time Text Detection and Recognition](https://arxiv.org/pdf/2011.00380) [J]. arXiv preprint arXiv:2011.00380.

- Shubham Vatsal, Nikhil Arora, Gopi Ramena, Sukumar Moharana, Dhruval Jain, Naresh Purre, Rachit S Munjal .[On-Device Language Identification of Text in Images using Diacritic Characters](https://arxiv.org/pdf/2011.05108) [J]. arXiv preprint arXiv:2011.05108.

- Shruti Rijhwani, Antonios Anastasopoulos, Graham Neubig .[OCR Post Correction for Endangered Language Texts](https://arxiv.org/pdf/2011.05402) [J]. arXiv preprint arXiv:2011.05402.

- Kunhong Yu, Yuze Zhang .[Digging Deeper into CRNN Model in Chinese Text Images Recognition](https://arxiv.org/pdf/2011.08505) [J]. arXiv preprint arXiv:2011.08505.

- Xuewei Bian, Chaoqun Wang, Weize Quan, Juntao Ye, Xiaopeng Zhang, Dong-Ming Yan .[Scene text removal via cascaded text stroke detection and erasing](https://arxiv.org/pdf/2011.09768) [J]. arXiv preprint arXiv:2011.09768.

- Yuanqiang Cai, Chang Liu, Weiqiang Wang, Qixiang Ye .[Towards Spatio-Temporal Video Scene Text Detection via Temporal Clustering](https://arxiv.org/pdf/2011.09781) [J]. arXiv preprint arXiv:2011.09781.

- Dhruval Jain, Arun D Prabhu, Gopi Ramena, Manoj Goyal, Debi Prasanna Mohanty, Sukumar Moharana, Naresh Purre .[On-Device Text Image Super Resolution](https://arxiv.org/pdf/2011.10251) [J]. arXiv preprint arXiv:2011.10251.

- Weijia Wu, Enze Xie, Ruimao Zhang, Wenhai Wang, Guan Pang, Zhen Li, Hong Zhou, Ping Luo .[SelfText Beyond Polygon: Unconstrained Text Detection with Box Supervision and Dynamic Self-Training](https://arxiv.org/pdf/2011.13307) [J]. arXiv preprint arXiv:2011.13307.

- Chuang Yang, Zhitong Xiong, Mulin Chen, Qi Wang, Xuelong Li .[BOTD: Bold Outline Text Detector](https://arxiv.org/pdf/2011.14714) [J]. arXiv preprint arXiv:2011.14714.

- Mengbiao Zhao, Wei Feng, Fei Yin, Xu-Yao Zhang, Cheng-Lin Liu .[Weakly-Supervised Arbitrary-Shaped Text Detection with Expectation-Maximization Algorithm](https://arxiv.org/pdf/2012.00424) [J]. arXiv preprint arXiv:2012.00424.

- José Carlos Aradillas, Juan José Murillo-Fuentes, Pablo M. Olmos .[Boosting offline handwritten text recognition in historical documents with few labeled lines](https://arxiv.org/pdf/2012.02544) [J]. arXiv preprint arXiv:2012.02544.

- Denis Coquenet, Clément Chatelain, Thierry Paquet .[End-to-end Handwritten Paragraph Text Recognition Using a Vertical Attention Network](https://arxiv.org/pdf/2012.03868) [J]. arXiv preprint arXiv:2012.03868.

- Andrés Mafla, Rafael Sampaio de Rezende, Lluís Gómez, Diane Larlus, Dimosthenis Karatzas .[StacMR: Scene-Text Aware Cross-Modal Retrieval](https://arxiv.org/pdf/2012.04329) [J]. arXiv preprint arXiv:2012.04329.

- Liang Qiao, Ying Chen, Zhanzhan Cheng, Yunlu Xu, Yi Niu, Shiliang Pu, Fei Wu .[MANGO: A Mask Attention Guided One-Stage Scene Text Spotter](https://arxiv.org/pdf/2012.04350) [J]. arXiv preprint arXiv:2012.04350.

- Denis Coquenet, Yann Soullard, Clément Chatelain, Thierry Paquet .[Have convolutions already made recurrence obsolete for unconstrained handwritten text recognition ?](https://arxiv.org/pdf/2012.04954) [J]. arXiv preprint arXiv:2012.04954.

- Denis Coquenet, Clément Chatelain, Thierry Paquet .[Recurrence-free unconstrained handwritten text recognition using gated fully convolutional network](https://arxiv.org/pdf/2012.04961) [J]. arXiv preprint arXiv:2012.04961.

- Wenqing Zhang, Yang Qiu, Minghui Liao, Rui Zhang, Xiaolin Wei, Xiang Bai .[Scene Text Detection with Scribble Lines](https://arxiv.org/pdf/2012.05030) [J]. arXiv preprint arXiv:2012.05030.

- Fukang Tian, Haiyu Wu, Bo Xu .[Research on All-content Text Recognition Method for Financial Ticket Image](https://arxiv.org/pdf/2012.08168) [J]. arXiv preprint arXiv:2012.08168.

- Xuan Qin, Meizhu Liu, Yifan Hu, Christina Moo, Christian M. Riblet, Changwei Hu, Kevin Yen, Haibin Ling .[Political Posters Identification with Appearance-Text Fusion](https://arxiv.org/pdf/2012.10728) [J]. arXiv preprint arXiv:2012.10728.

- Ron Slossberg, Oron Anschel, Amir Markovitz, Ron Litman, Aviad Aberdam, Shahar Tsiper, Shai Mazor, Jon Wu, R. Manmatha .[On Calibration of Scene-Text Recognition Models](https://arxiv.org/pdf/2012.12643) [J]. arXiv preprint arXiv:2012.12643.

- Mélodie Boillet, Christopher Kermorvant, Thierry Paquet .[Multiple Document Datasets Pre-training Improves Text Line Detection With Deep Neural Networks](https://arxiv.org/pdf/2012.14163) [J]. arXiv preprint arXiv:2012.14163.

- Vasiliki Tassopoulou, George Retsinas, Petros Maragos .[Enhancing Handwritten Text Recognition with N-gram sequence decomposition and Multitask Learning](https://arxiv.org/pdf/2012.14459) [J]. arXiv preprint arXiv:2012.14459.

---

### 2021

- Sagar Gubbi, Bharadwaj Amrutur .[Scene Text Detection for Augmented Reality -- Character Bigram Approach to reduce False Positive Rate](https://arxiv.org/pdf/2101.01054) [J]. arXiv preprint arXiv:2101.01054.

- Fukang Tian, Haiyu Wu, Bo Xu .[Research on Fast Text Recognition Method for Financial Ticket Image](https://arxiv.org/pdf/2101.01310) [J]. arXiv preprint arXiv:2101.01310.

- Rulin Shao, Zhouxing Shi, Jinfeng Yi, Pin-Yu Chen, Cho-Jui Hsieh .[Robust Text CAPTCHAs Using Adversarial Examples](https://arxiv.org/pdf/2101.02483) [J]. arXiv preprint arXiv:2101.02483.

- Berat Kurar Barakat, Ahmad Droby, Reem Alaasam, Boraq Madi, Irina Rabaev, Jihad El-Sana .[Text line extraction using fully convolutional network and energy minimization](https://arxiv.org/pdf/2101.07370) [J]. arXiv preprint arXiv:2101.07370.

- Berat Kurar Barakat, Rafi Cohen, Irina Rabaev, Jihad El-Sana .[VML-MOC: Segmenting a multiply oriented and curved handwritten text lines dataset](https://arxiv.org/pdf/2101.07542) [J]. arXiv preprint arXiv:2101.07542.

- Berat Barakat, Ahmad Droby, Majeed Kassis, Jihad El-Sana .[Text Line Segmentation for Challenging Handwritten Document Images Using Fully Convolutional Network](https://arxiv.org/pdf/2101.08299) [J]. arXiv preprint arXiv:2101.08299.

- Christian M. Dahl, Torben Johansen, Emil N. Sørensen, Simon Wittrock .[HANA: A HAndwritten NAme Database for Offline Handwritten Text Recognition](https://arxiv.org/pdf/2101.10862) [J]. arXiv preprint arXiv:2101.10862.

- Daniyar Nurseitov, Kairat Bostanbekov, Maksat Kanatov, Anel Alimova, Abdelrahman Abdallah, Galymzhan Abdimanap .[Classification of Handwritten Names of Cities and Handwritten Text Recognition using Various Deep Learning Models](https://arxiv.org/pdf/2102.04816) [J]. arXiv preprint arXiv:2102.04816.

- Hongxiang Cai, Jun Sun, Yichao Xiong .[CSTR: A Classification Perspective on Scene Text Recognition](https://arxiv.org/pdf/2102.10884) [J]. arXiv preprint arXiv:2102.10884.

- Chuhui Xue, Shijian Lu, Steven Hoi .[Detection and Rectification of Arbitrary Shaped Scene Texts by using Text Keypoints and Links](https://arxiv.org/pdf/2103.00785) [J]. arXiv preprint arXiv:2103.00785.

- Jeonghun Baek, Yusuke Matsui, Kiyoharu Aizawa .[What If We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels](https://arxiv.org/pdf/2103.04400) [J]. arXiv preprint arXiv:2103.04400.

- Muhammad Kashif .[Urdu Handwritten Text Recognition Using ResNet18](https://arxiv.org/pdf/2103.05105) [J]. arXiv preprint arXiv:2103.05105.

- Jan Kohút, Michal Hradiš .[TS-Net: OCR Trained to Switch Between Text Transcription Styles](https://arxiv.org/pdf/2103.05489) [J]. arXiv preprint arXiv:2103.05489.

- Shancheng Fang, Hongtao Xie, Yuxin Wang, Zhendong Mao, Yongdong Zhang .[Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition](https://arxiv.org/pdf/2103.06495) [J]. arXiv preprint arXiv:2103.06495.

- Chenwei Cui, Liangfu Lu, Zhiyuan Tan, Amir Hussain .[Conceptual Text Region Network: Cognition-Inspired Accurate Scene Text Detection](https://arxiv.org/pdf/2103.09179) [J]. arXiv preprint arXiv:2103.09179.

- Jiajun Zhu, Xiufeng Jiang, Zhiwei Jia, Shugong Xu, Shan Cao .[Tracking Based Semi-Automatic Annotation for Scene Text Videos](https://arxiv.org/pdf/2103.15488) [J]. arXiv preprint arXiv:2103.15488.

- Xiufeng Jiang, Shugong Xu (Fellow, IEEE), Shunqing Zhang (Senior Member, IEEE), Shan Cao .[Arbitrary-Shaped Text Detection withAdaptive Text Region Representation](https://arxiv.org/pdf/2104.00297) [J]. arXiv preprint arXiv:2104.00297.

- Shintaro Nishi, Takeaki Kadota, Seiichi Uchida .[Famous Companies Use More Letters in Logo:A Large-Scale Analysis of Text Area in Logo](https://arxiv.org/pdf/2104.00327) [J]. arXiv preprint arXiv:2104.00327.

- Minghang He, Minghui Liao, Zhibo Yang, Humen Zhong, Jun Tang, Wenqing Cheng, Cong Yao, Yongpan Wang, Xiang Bai .[MOST: A Multi-Oriented Scene Text Detector with Localization Refinement](https://arxiv.org/pdf/2104.01070) [J]. arXiv preprint arXiv:2104.01070.

- Hao Wang, Xiang Bai, Mingkun Yang, Shenggao Zhu, Jing Wang, Wenyu Liu .[Scene Text Retrieval via Joint Text Detection and Similarity Learning](https://arxiv.org/pdf/2104.01552) [J]. arXiv preprint arXiv:2104.01552.

- Ayan Kumar Bhunia, Shuvozit Ghose, Amandeep Kumar, Pinaki Nath Chowdhury, Aneeshan Sain, Yi-Zhe Song .[MetaHTR: Towards Writer-Adaptive Handwritten Text Recognition](https://arxiv.org/pdf/2104.01876) [J]. arXiv preprint arXiv:2104.01876.

- Qiyao Wang, Pengfei Li, Li Zhu, Yi Niu .[1st Place Solution to ICDAR 2021 RRC-ICTEXT End-to-end Text Spotting and Aesthetic Assessment on Integrated Circuit](https://arxiv.org/pdf/2104.03544) [J]. arXiv preprint arXiv:2104.03544.

- Minesh Mathew, Mohit Jain, CV Jawahar .[Benchmarking Scene Text Recognition in Devanagari, Telugu and Malayalam](https://arxiv.org/pdf/2104.04437) [J]. arXiv preprint arXiv:2104.04437.

- Chuang Yang, Mulin Chen, Qi Wang, Xuelong Li .[RayNet: Real-time Scene Arbitrary-shape Text Detection with Multiple Rays](https://arxiv.org/pdf/2104.04903) [J]. arXiv preprint arXiv:2104.04903.

- Pengfei Wang, Chengquan Zhang, Fei Qi, Shanshan Liu, Xiaoqiang Zhang, Pengyuan Lyu, Junyu Han, Jingtuo Liu, Errui Ding, Guangming Shi .[PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network](https://arxiv.org/pdf/2104.05458) [J]. arXiv preprint arXiv:2104.05458.

- Daniel Hernandez Diaz, Siyang Qin, Reeve Ingle, Yasuhisa Fujii, Alessandro Bissacco .[Rethinking Text Line Recognition Models](https://arxiv.org/pdf/2104.07787) [J]. arXiv preprint arXiv:2104.07787.

- Rachit S Munjal, Manoj Goyal, Rutika Moharir, Sukumar Moharana .[TeLCoS: OnDevice Text Localization with Clustering of Script](https://arxiv.org/pdf/2104.08045) [J]. arXiv preprint arXiv:2104.08045.

- Nidhi Gupta, Wenju Liu .[Line Segmentation from Unconstrained Handwritten Text Images using Adaptive Approach](https://arxiv.org/pdf/2104.08777) [J]. arXiv preprint arXiv:2104.08777.

- Ue-Hwan Kim, Yewon Hwang, Sun-Kyung Lee, Jong-Hwan Kim .[Writing in The Air: Unconstrained Text Recognition from Finger Movement Using Spatio-Temporal Convolution](https://arxiv.org/pdf/2104.09021) [J]. arXiv preprint arXiv:2104.09021.

- Yiqin Zhu, Jianyong Chen, Lingyu Liang, Zhanghui Kuang, Lianwen Jin, Wayne Zhang .[Fourier Contour Embedding for Arbitrary-Shaped Text Detection](https://arxiv.org/pdf/2104.10442) [J]. arXiv preprint arXiv:2104.10442.

- Zhengmi Tang, Tomo Miyazaki, Yoshihiro Sugaya, Shinichiro Omachi .[Stroke-Based Scene Text Erasing Using Synthetic Data for Training](https://arxiv.org/pdf/2104.11493) [J]. arXiv preprint arXiv:2104.11493.

- Usman Sajid, Michael Chow, Jin Zhang, Taejoon Kim, Guanghui Wang .[Parallel Scale-wise Attention Network for Effective Scene Text Recognition](https://arxiv.org/pdf/2104.12076) [J]. arXiv preprint arXiv:2104.12076.

- Wenhai Wang, Enze Xie, Xiang Li, Xuebo Liu, Ding Liang, Zhibo Yang, Tong Lu, Chunhua Shen .[PAN++: Towards Efficient and Accurate End-to-End Spotting of Arbitrarily-Shaped Text](https://arxiv.org/pdf/2105.00405) [J]. arXiv preprint arXiv:2105.00405.

- Yuliang Liu, Chunhua Shen, Lianwen Jin, Tong He, Peng Chen, Chongyu Liu, Hao Chen .[ABCNet v2: Adaptive Bezier-Curve Network for Real-time End-to-end Text Spotting](https://arxiv.org/pdf/2105.03620) [J]. arXiv preprint arXiv:2105.03620.

- Oren Nuriel, Sharon Fogel, Ron Litman .[TextAdaIN: Fine-Grained AdaIN for Robust Text Recognition](https://arxiv.org/pdf/2105.03906) [J]. arXiv preprint arXiv:2105.03906.

- Ruijie Yan, Liangrui Peng, Shanyu Xiao, Gang Yao .[Primitive Representation Learning for Scene Text Recognition](https://arxiv.org/pdf/2105.04286) [J]. arXiv preprint arXiv:2105.04286.

- Julian D. Gilbey, Carola-Bibiane Schönlieb .[An end-to-end Optical Character Recognition approach for ultra-low-resolution printed text images](https://arxiv.org/pdf/2105.04515) [J]. arXiv preprint arXiv:2105.04515.

- Mohamed Ali Souibgui, Ali Furkan Biten, Sounak Dey, Alicia Fornés, Yousri Kessentini, Lluis Gomez, Dimosthenis Karatzas, Josep Lladós .[One-shot Compositional Data Generation for Low Resource Handwritten Text Recognition](https://arxiv.org/pdf/2105.05300) [J]. arXiv preprint arXiv:2105.05300.

- Chuang Yang, Mulin Chen, Yuan Yuan (Senior Member, IEEE), Qi Wang (Senior Member, IEEE) .[MT: Multi-Perspective Feature Learning Network for Scene Text Detection](https://arxiv.org/pdf/2105.05455) [J]. arXiv preprint arXiv:2105.05455.

- Amanpreet Singh, Guan Pang, Mandy Toh, Jing Huang, Wojciech Galuba, Tal Hassner .[TextOCR: Towards large-scale end-to-end reasoning for arbitrary-shaped scene text](https://arxiv.org/pdf/2105.05486) [J]. arXiv preprint arXiv:2105.05486.

- Hui Jiang, Yunlu Xu, Zhanzhan Cheng, Shiliang Pu, Yi Niu, Wenqi Ren, Fei Wu, Wenming Tan .[Reciprocal Feature Learning via Explicit and Implicit Tasks in Scene Text Recognition](https://arxiv.org/pdf/2105.06229) [J]. arXiv preprint arXiv:2105.06229.

- Rachit S Munjal, Arun D Prabhu, Nikhil Arora, Sukumar Moharana, Gopi Ramena .[STRIDE : Scene Text Recognition In-Device](https://arxiv.org/pdf/2105.07795) [J]. arXiv preprint arXiv:2105.07795.

- Chuhui Xue, Shijian Lu, Song Bai, Wenqing Zhang, Changhu Wang .[I2C2W: Image-to-Character-to-Word Transformers for Accurate Scene Text Recognition](https://arxiv.org/pdf/2105.08383) [J]. arXiv preprint arXiv:2105.08383.

- Rowel Atienza .[Vision Transformer for Fast and Efficient Scene Text Recognition](https://arxiv.org/pdf/2105.08582) [J]. arXiv preprint arXiv:2105.08582.

- Berat Kurar Barakat, Ahmad Droby, Raid Saabni, Jihad El-Sana .[Unsupervised learning of text line segmentation by differentiating coarse patterns](https://arxiv.org/pdf/2105.09405) [J]. arXiv preprint arXiv:2105.09405.

- Deng Li, Yue Wu, Yicong Zhou .[LineCounter: Learning Handwritten Text Line Segmentation by Counting](https://arxiv.org/pdf/2105.11307) [J]. arXiv preprint arXiv:2105.11307.

- Taylor Archibald, Mason Poggemann, Aaron Chan, Tony Martinez .[TRACE: A Differentiable Approach to Line-level Stroke Recovery for Offline Handwritten Text](https://arxiv.org/pdf/2105.11559) [J]. arXiv preprint arXiv:2105.11559.

- Eun-Soo Jung, HyeongGwan Son, Kyusam Oh, Yongkeun Yun, Soonhwan Kwon, Min Soo Kim .[DUET: Detection Utilizing Enhancement for Text in Scanned or Captured Documents](https://arxiv.org/pdf/2106.05542) [J]. arXiv preprint arXiv:2106.05542.

- Tianwei Wang, Yuanzhi Zhu, Lianwen Jin, Dezhi Peng, Zhe Li, Mengchao He, Yongpan Wang, Canjie Luo .[Implicit Feature Alignment: Learn to Convert Text Recognizer to Text Spotter](https://arxiv.org/pdf/2106.05920) [J]. arXiv preprint arXiv:2106.05920.

- Mengmeng Cui, Wei Wang, Jinjin Zhang, Liang Wang .[Representation and Correlation Enhanced Encoder-Decoder Framework for Scene Text Recognition](https://arxiv.org/pdf/2106.06960) [J]. arXiv preprint arXiv:2106.06960.

- Praveen Krishnan, Rama Kovvuri, Guan Pang, Boris Vassilev, Tal Hassner .[TextStyleBrush: Transfer of Text Aesthetics from a Single Example](https://arxiv.org/pdf/2106.08385) [J]. arXiv preprint arXiv:2106.08385.

- Ilya Krylov, Sergei Nosov, Vladislav Sovrasov .[Open Images V5 Text Annotation and Yet Another Mask Text Spotter](https://arxiv.org/pdf/2106.12326) [J]. arXiv preprint arXiv:2106.12326.

- Meng Cao, Can Zhang, Dongming Yang, Yuexian Zou .[All You Need is a Second Look: Towards Arbitrary-Shaped Text Detection](https://arxiv.org/pdf/2106.12720) [J]. arXiv preprint arXiv:2106.12720.

- Yuxin Wang, Hongtao Xie, Shancheng Fang, Yadong Qu, Yongdong Zhang .[A Simple and Strong Baseline: Progressively Region-based Scene Text Removal Networks](https://arxiv.org/pdf/2106.13029) [J]. arXiv preprint arXiv:2106.13029.

- Trung Tan Ngo, Hung Tuan Nguyen, Nam Tuan Ly, Masaki Nakagawa .[Recurrent neural network transducer for Japanese and Chinese offline handwritten text recognition](https://arxiv.org/pdf/2106.14459) [J]. arXiv preprint arXiv:2106.14459.

- Jianqi Ma, Shi Guo, Lei Zhang .[Text Prior Guided Scene Text Image Super-resolution](https://arxiv.org/pdf/2106.15368) [J]. arXiv preprint arXiv:2106.15368.

- Zhihao Wang, Yanwei Yu, Yibo Wang, Haixu Long, Fazheng Wang .[Robust End-to-End Offline Chinese Handwriting Text Page Spotter with Text Kernel](https://arxiv.org/pdf/2107.01547) [J]. arXiv preprint arXiv:2107.01547.

- Chun Chet Ng, Akmalul Khairi Bin Nazaruddin, Yeong Khang Lee, Xinyu Wang, Yuliang Liu, Chee Seng Chan, Lianwen Jin, Yipeng Sun, Lixin Fan .[ICDAR 2021 Competition on Integrated Circuit Text Spotting and Aesthetic Assessment](https://arxiv.org/pdf/2107.05279) [J]. arXiv preprint arXiv:2107.05279.

- Tao Sheng, Jie Chen, Zhouhui Lian .[CentripetalText: An Efficient Text Instance Representation for Scene Text Detection](https://arxiv.org/pdf/2107.05945) [J]. arXiv preprint arXiv:2107.05945.

- Tao Sheng, Zhouhui Lian .[Bidirectional Regression for Arbitrary-Shaped Text Detection](https://arxiv.org/pdf/2107.06129) [J]. arXiv preprint arXiv:2107.06129.

- Moonbin Yim, Yoonsik Kim, Han-Cheol Cho, Sungrae Park .[SynthTIGER: Synthetic Text Image GEneratoR Towards Better Text Recognition Models](https://arxiv.org/pdf/2107.09313) [J]. arXiv preprint arXiv:2107.09313.

- Junyeop Lee, Yoonsik Kim, Seonghyeon Kim, Moonbin Yim, Seung Shin, Gayoung Lee, Sungrae Park .[RewriteNet: Realistic Scene Text Image Generation via Editing Text in Real-world Image](https://arxiv.org/pdf/2107.11041) [J]. arXiv preprint arXiv:2107.11041.

- Pengwen Dai, Xiaochun Cao .[Comprehensive Studies for Arbitrary-shape Scene Text Detection](https://arxiv.org/pdf/2107.11800) [J]. arXiv preprint arXiv:2107.11800.

- Zhanzhan Cheng, Jing Lu, Baorui Zou, Shuigeng Zhou, Fei Wu .[ICDAR 2021 Competition on Scene Video Text Spotting](https://arxiv.org/pdf/2107.11919) [J]. arXiv preprint arXiv:2107.11919.

- Ayan Kumar Bhunia, Pinaki Nath Chowdhury, Aneeshan Sain, Yi-Zhe Song .[Towards the Unseen: Iterative Text Recognition by Distilling from Errors](https://arxiv.org/pdf/2107.12081) [J]. arXiv preprint arXiv:2107.12081.

- Ayan Kumar Bhunia, Aneeshan Sain, Pinaki Nath Chowdhury, Yi-Zhe Song .[Text is Text, No Matter What: Unifying Text Recognition using Knowledge Distillation](https://arxiv.org/pdf/2107.12087) [J]. arXiv preprint arXiv:2107.12087.

- Ayan Kumar Bhunia, Aneeshan Sain, Amandeep Kumar, Shuvozit Ghose, Pinaki Nath Chowdhury, Yi-Zhe Song .[Joint Visual Semantic Reasoning: Multi-Stage Decoder for Text Recognition](https://arxiv.org/pdf/2107.12090) [J]. arXiv preprint arXiv:2107.12090.

- Shi-Xue Zhang, Xiaobin Zhu, Chun Yang, Hongfa Wang, Xu-Cheng Yin .[Adaptive Boundary Proposal Network for Arbitrary Shape Text Detection](https://arxiv.org/pdf/2107.12664) [J]. arXiv preprint arXiv:2107.12664.

- Vladimir Loginov .[Why You Should Try the Real Data for the Scene Text Recognition](https://arxiv.org/pdf/2107.13938) [J]. arXiv preprint arXiv:2107.13938.

- Jian Ye, Jing Zhang, Juhua Liu, Bo Du, Dacheng Tao .[I3CL:Intra- and Inter-Instance Collaborative Learning for Arbitrary-shaped Scene Text Detection](https://arxiv.org/pdf/2108.01343) [J]. arXiv preprint arXiv:2108.01343.

- Zhiwei Jia, Shugong Xu, Shiyi Mu, Yue Tao, Shan Cao, Zhiyong Chen .[IFR: Iterative Fusion Based Recognizer For Low Quality Scene Text Recognition](https://arxiv.org/pdf/2108.06166) [J]. arXiv preprint arXiv:2108.06166.

- Zhanghui Kuang, Hongbin Sun, Zhizhong Li, Xiaoyu Yue, Tsui Hin Lin, Jianyong Chen, Huaqiang Wei, Yiqin Zhu, Tong Gao, Wenwei Zhang, Kai Chen, Wayne Zhang, Dahua Lin .[MMOCR: A Comprehensive Toolbox for Text Detection, Recognition and Understanding](https://arxiv.org/pdf/2108.06543) [J]. arXiv preprint arXiv:2108.06543.

- Shiyu Hou, Chaoqun Wang, Weize Quan, Jingen Jiang, Dong-Ming Yan .[Text-Aware Single Image Specular Highlight Removal](https://arxiv.org/pdf/2108.06881) [J]. arXiv preprint arXiv:2108.06881.

- Rowel Atienza .[Data Augmentation for Scene Text Recognition](https://arxiv.org/pdf/2108.06949) [J]. arXiv preprint arXiv:2108.06949.

- Xiaopeng Lu, Zhen Fan, Yansen Wang, Jean Oh, Carolyn P. Rose .[Localize, Group, and Select: Boosting Text-VQA by Scene Text Modeling](https://arxiv.org/pdf/2108.08965) [J]. arXiv preprint arXiv:2108.08965.

- Yuxin Wang, Hongtao Xie, Shancheng Fang, Jing Wang, Shenggao Zhu, Yongdong Zhang .[From Two to One: A New Scene Text Recognizer with Visual Language Modeling Network](https://arxiv.org/pdf/2108.09661) [J]. arXiv preprint arXiv:2108.09661.

- Alex Shonenkov, Denis Karachev, Maxim Novopoltsev, Mark Potanin, Denis Dimitrov .[StackMix and Blot Augmentations for Handwritten Text Recognition](https://arxiv.org/pdf/2108.11667) [J]. arXiv preprint arXiv:2108.11667.

- Nathan Zachary, Gerald Carl, Russell Elijah, Hessi Roma, Robert Leer, James Amelia .[Scene Text recognition with Full Normalization](https://arxiv.org/pdf/2109.01034) [J]. arXiv preprint arXiv:2109.01034.

- Vijay Kumar B G, Jeyasri Subramanian, Varnith Chordia, Eugene Bart, Shaobo Fang, Kelly Guan, Raja Bala .[STRIVE: Scene Text Replacement In Videos](https://arxiv.org/pdf/2109.02762) [J]. arXiv preprint arXiv:2109.02762.

- Xugong Qin, Yu Zhou, Youhui Guo, Dayan Wu, Zhihong Tian, Ning Jiang, Hongbin Wang, Weiping Wang .[Mask is All You Need: Rethinking Mask R-CNN for Dense and Arbitrary-Shaped Scene Text Detection](https://arxiv.org/pdf/2109.03426) [J]. arXiv preprint arXiv:2109.03426.

- Youhui Guo, Yu Zhou, Xugong Qin, Weiping Wang .[Which and Where to Focus: A Simple yet Accurate Framework for Arbitrary-Shaped Nearby Text Detection in Scene Images](https://arxiv.org/pdf/2109.03451) [J]. arXiv preprint arXiv:2109.03451.

- Zhi Qiao, Yu Zhou, Jin Wei, Wei Wang, Yuan Zhang, Ning Jiang, Hongbin Wang, Weiping Wang .[PIMNet: A Parallel, Iterative and Mimicking Network for Scene Text Recognition](https://arxiv.org/pdf/2109.04145) [J]. arXiv preprint arXiv:2109.04145.

- Hazrat Ali, Khalid Iqbal, Ghulam Mujtaba, Ahmad Fayyaz, Mohammad Farhad Bulbul, Fazal Wahab Karam, Ali Zahir .[Urdu text in natural scene images: a new dataset and preliminary text detection](https://arxiv.org/pdf/2109.08060) [J]. arXiv preprint arXiv:2109.08060.

- Wataru Shimoda, Daichi Haraguchi, Seiichi Uchida, Kota Yamaguchi .[De-rendering Stylized Texts](https://arxiv.org/pdf/2110.01890) [J]. arXiv preprint arXiv:2110.01890.

- Nazgul Toiganbayeva, Mahmoud Kasem, Galymzhan Abdimanap, Kairat Bostanbekov, Abdelrahman Abdallah, Anel Alimova, Daniyar Nurseitov .[KOHTD: Kazakh Offline Handwritten Text Dataset](https://arxiv.org/pdf/2110.04075) [J]. arXiv preprint arXiv:2110.04075.

- Shilian Wu, Wei Zhai, Yongrui Li, Kewei Wang, Zengfu Wang .[On Exploring and Improving Robustness of Scene Text Detection Models](https://arxiv.org/pdf/2110.05700) [J]. arXiv preprint arXiv:2110.05700.

- Christoph Wick, Jochen Zöllner, Tobias Grüning .[Rescoring Sequence-to-Sequence Models for Text Line Recognition with CTC-Prefixes](https://arxiv.org/pdf/2110.05909) [J]. arXiv preprint arXiv:2110.05909.

- Humen Zhong, Jun Tang, Wenhai Wang, Zhibo Yang, Cong Yao, Tong Lu .[ARTS: Eliminating Inconsistency between Text Detection and Recognition with Auto-Rectification Text Spotter](https://arxiv.org/pdf/2110.10405) [J]. arXiv preprint arXiv:2110.10405.

- Tongkun Guan, Chaochen Gu, Changsheng Lu, Jingzheng Tu, Qi Feng, Kaijie Wu, Xinping Guan .[Industrial Scene Text Detection with Refined Feature-attentive Network](https://arxiv.org/pdf/2110.12663) [J]. arXiv preprint arXiv:2110.12663.

- Wei Wang .[TPSNet: Thin-Plate-Spline Representation for Arbitrary Shape Scene Text Detection](https://arxiv.org/pdf/2110.12826) [J]. arXiv preprint arXiv:2110.12826.

- Zhe Chen, Wenhai Wang, Enze Xie, ZhiBo Yang, Tong Lu, Ping Luo .[FAST: Searching for a Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation](https://arxiv.org/pdf/2111.02394) [J]. arXiv preprint arXiv:2111.02394.

- Baoguang Shi, Wenfeng Cheng, Yijuan Lu, Cha Zhang, Dinei Florencio .[Improving Structured Text Recognition with Regular Expression Biasing](https://arxiv.org/pdf/2111.06738) [J]. arXiv preprint arXiv:2111.06738.

- Yue Tao, Zhiwei Jia, Runze Ma, Shugong Xu .[TRIG: Transformer-Based Text Recognizer with Initial Embedding Guidance](https://arxiv.org/pdf/2111.08314) [J]. arXiv preprint arXiv:2111.08314.

- Chuang Yang, Mulin Chen, Yuan Yuan, Qi Wang, Xuelong Li .[Adaptive Shrink-Mask for Text Detection](https://arxiv.org/pdf/2111.09560) [J]. arXiv preprint arXiv:2111.09560.

- Abhishek Srivastava, Sukalpa Chanda, Umapada Pal .[Exploiting Multi-Scale Fusion, Spatial Attention and Patch Interaction Techniques for Text-Independent Writer Identification](https://arxiv.org/pdf/2111.10605) [J]. arXiv preprint arXiv:2111.10605.

- Tianlun Zheng, Zhineng Chen, Shancheng Fang, Hongtao Xie, Yu-Gang Jiang .[CDistNet: Perceiving Multi-Domain Character Distance for Robust Text Recognition](https://arxiv.org/pdf/2111.11011) [J]. arXiv preprint arXiv:2111.11011.

- Shota Orihashi, Yoshihiro Yamazaki, Naoki Makishima, Mana Ihori, Akihiko Takashima, Tomohiro Tanaka, Ryo Masumura .[Utilizing Resource-Rich Language Datasets for End-to-End Scene Text Recognition in Resource-Poor Languages](https://arxiv.org/pdf/2111.12276) [J]. arXiv preprint arXiv:2111.12276.

- Changxu Cheng, Bohan Li, Qi Zheng, Yongpan Wang, Wenyu Liu .[Decoupling Visual-Semantic Feature Learning for Robust Scene Text Recognition](https://arxiv.org/pdf/2111.12351) [J]. arXiv preprint arXiv:2111.12351.

- Yi-Chang Chen, Yu-Chuan Chang, Yen-Cheng Chang, Yi-Ren Yeh .[Traditional Chinese Synthetic Datasets Verified with Labeled Data for Scene Text Recognition](https://arxiv.org/pdf/2111.13327) [J]. arXiv preprint arXiv:2111.13327.

- Qi Zhao, Yufei Wang, Shuchang Lyu, Lijiang Chen .[Attention-based Feature Decomposition-Reconstruction Network for Scene Text Detection](https://arxiv.org/pdf/2111.14340) [J]. arXiv preprint arXiv:2111.14340.

- Byeonghu Na, Yoonsik Kim, Sungrae Park .[Multi-modal Text Recognition Networks: Interactive Enhancements between Visual and Semantic Features](https://arxiv.org/pdf/2111.15263) [J]. arXiv preprint arXiv:2111.15263.

- Yujie Zhang .[Natural Scene Text Editing Based on AI](https://arxiv.org/pdf/2111.15475) [J]. arXiv preprint arXiv:2111.15475.

- Rutika Moharir, Arun D Prabhu, Sukumar Moharana, Gopi Ramena, Rachit S Munjal .[On-Device Spatial Attention based Sequence Learning Approach for Scene Text Script Identification](https://arxiv.org/pdf/2112.00448) [J]. arXiv preprint arXiv:2112.00448.

- Xin Tang, Yongquan Lai, Ying Liu, Yuanyuan Fu, Rui Fang .[Visual-Semantic Transformer for Scene Text Recognition](https://arxiv.org/pdf/2112.00948) [J]. arXiv preprint arXiv:2112.00948.

- Weijia Wu, Yuanqiang Cai, Debing Zhang, Sibo Wang, Zhuang Li, Jiahong Li, Yejun Tang, Hong Zhou .[A Bilingual, OpenWorld Video Text Dataset and End-to-end Video Text Spotter with Transformer](https://arxiv.org/pdf/2112.04888) [J]. arXiv preprint arXiv:2112.04888.

- Zekun Li, Runyu Guan, Qianmu Yu, Yao-Yi Chiang, Craig A. Knoblock .[Synthetic Map Generation to Provide Unlimited Training Data for Historical Map Text Detection](https://arxiv.org/pdf/2112.06104) [J]. arXiv preprint arXiv:2112.06104.

- Alex Shonenkov, Denis Karachev, Max Novopoltsev, Mark Potanin, Denis Dimitrov, Andrey Chertok .[Handwritten text generation and strikethrough characters augmentation](https://arxiv.org/pdf/2112.07395) [J]. arXiv preprint arXiv:2112.07395.

- Jingyang Lin, Yingwei Pan, Rongfeng Lai, Xuehang Yang, Hongyang Chao, Ting Yao .[CORE-Text: Improving Scene Text Detection with Contrastive Relational Reasoning](https://arxiv.org/pdf/2112.07513) [J]. arXiv preprint arXiv:2112.07513.

- Dezhi Peng, Xinyu Wang, Yuliang Liu, Jiaxin Zhang, Mingxin Huang, Songxuan Lai, Shenggao Zhu, Jing Li, Dahua Lin, Chunhua Shen, Lianwen Jin .[SPTS: Single-Point Text Spotting](https://arxiv.org/pdf/2112.07917) [J]. arXiv preprint arXiv:2112.07917.

- Jingye Chen, Haiyang Yu, Jianqi Ma, Bin Li, Xiangyang Xue .[Text Gestalt: Stroke-Aware Scene Text Image Super-Resolution](https://arxiv.org/pdf/2112.08171) [J]. arXiv preprint arXiv:2112.08171.

- Umut Kocasari, Alara Dirik, Mert Tiftikci, Pinar Yanardag .[StyleMC: Multi-Channel Based Fast Text-Guided Image Generation and Manipulation](https://arxiv.org/pdf/2112.08493) [J]. arXiv preprint arXiv:2112.08493.

- Zhuang Li, Weijia Wu, Mike Zheng Shou, Jiahong Li, Size Li, Zhongyuan Wang, Hong Zhou .[Contrastive Learning of Semantic and Visual Representations for Text Tracking](https://arxiv.org/pdf/2112.14976) [J]. arXiv preprint arXiv:2112.14976.

- Jingye Chen, Haiyang Yu, Jianqi Ma, Mengnan Guan, Xixi Xu, Xiaocong Wang, Shaobo Qu, Bin Li, Xiangyang Xue .[Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study](https://arxiv.org/pdf/2112.15093) [J]. arXiv preprint arXiv:2112.15093.

---

### 2022

- Bao Hieu Tran, Thanh Le-Cong, Huu Manh Nguyen, Duc Anh Le, Thanh Hung Nguyen, Phi Le Nguyen .[SAFL: A Self-Attention Scene Text Recognizer with Focal Loss](https://arxiv.org/pdf/2201.00132) [J]. arXiv preprint arXiv:2201.00132.

- Ning Zhang, Mohammadreza Ebrahimi, Weifeng Li, Hsinchun Chen .[Counteracting Dark Web Text-Based CAPTCHA with Generative Adversarial Learning for Proactive Cyber Threat Intelligence](https://arxiv.org/pdf/2201.02799) [J]. arXiv preprint arXiv:2201.02799.

- Sanjana Gunna, Rohit Saluja, C. V. Jawahar .[Transfer Learning for Scene Text Recognition in Indian Languages](https://arxiv.org/pdf/2201.03180) [J]. arXiv preprint arXiv:2201.03180.

- Sanjana Gunna, Rohit Saluja, C. V. Jawahar .[Towards Boosting the Accuracy of Non-Latin Scene Text Recognition](https://arxiv.org/pdf/2201.03185) [J]. arXiv preprint arXiv:2201.03185.

- Emanuel Metzenthin, Christian Bartz, Christoph Meinel .[Weakly Supervised Scene Text Detection using Deep Reinforcement Learning](https://arxiv.org/pdf/2201.04866) [J]. arXiv preprint arXiv:2201.04866.

- Christian Reul, Stefan Tomasek, Florian Langhanki, Uwe Springmann .[Open Source Handwritten Text Recognition on Medieval Manuscripts using Mixed Models and Document-Specific Finetuning](https://arxiv.org/pdf/2201.07661) [J]. arXiv preprint arXiv:2201.07661.

- Dmitrijs Kass, Ekta Vats .[AttentionHTR: Handwritten Text Recognition Based on Attention Encoder-Decoder Networks](https://arxiv.org/pdf/2201.09390) [J]. arXiv preprint arXiv:2201.09390.

- Martin Kišš, Jan Kohút, Karel Beneš, Michal Hradiš .[Importance of Textlines in Historical Document Classification](https://arxiv.org/pdf/2201.09575) [J]. arXiv preprint arXiv:2201.09575.

- Mihaela Gaman, Lida Ghadamiyan, Radu Tudor Ionescu, Marius Popescu .[Self-paced learning to improve text row detection in historical documents with missing labels](https://arxiv.org/pdf/2201.12216) [J]. arXiv preprint arXiv:2201.12216.

- Yair Kittenplon, Inbal Lavi, Sharon Fogel, Yarin Bar, R. Manmatha, Pietro Perona .[Towards Weakly-Supervised Text Spotting using a Multi-Task Transformer](https://arxiv.org/pdf/2202.05508) [J]. arXiv preprint arXiv:2202.05508.

- Vineet Kumar, Suresh Sundaram .[Offline Text-Independent Writer Identification based on word level data](https://arxiv.org/pdf/2202.10207) [J]. arXiv preprint arXiv:2202.10207.

- Minghui Liao, Zhisheng Zou, Zhaoyi Wan, Cong Yao, Xiang Bai .[Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion](https://arxiv.org/pdf/2202.10304) [J]. arXiv preprint arXiv:2202.10304.

- Zobeir Raisi, Georges Younes, John Zelek .[Arbitrary Shape Text Detection using Transformers](https://arxiv.org/pdf/2202.11221) [J]. arXiv preprint arXiv:2202.11221.

- Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Zhe Li, Dezhi Peng .[SLOGAN: Handwriting Style Synthesis for Arbitrary-Length and Out-of-Vocabulary Text](https://arxiv.org/pdf/2202.11456) [J]. arXiv preprint arXiv:2202.11456.

- Tongkun Guan, Chaochen Gu, Jingzheng Tu, Xue Yang, Qi Feng .[A Glyph-driven Topology Enhancement Network for Scene Text Recognition](https://arxiv.org/pdf/2203.03382) [J]. arXiv preprint arXiv:2203.03382.

- Chuhui Xue, Yu Hao, Shijian Lu, Philip Torr, Song Bai .[Language Matters: A Weakly Supervised Pre-training Approach for Scene Text Detection and Spotting](https://arxiv.org/pdf/2203.03911) [J]. arXiv preprint arXiv:2203.03911.

- Mohamed Ali Souibgui, Sanket Biswas, Andres Mafla, Ali Furkan Biten, Alicia Fornés, Yousri Kessentini, Josep Lladós, Lluis Gomez, Dimosthenis Karatzas .[Text-DIAE: Degradation Invariant Autoencoders for Text Recognition and Document Enhancement](https://arxiv.org/pdf/2203.04814) [J]. arXiv preprint arXiv:2203.04814.

- Seonghyeon Kim, Seung Shin, Yoonsik Kim, Han-Cheol Cho, Taeho Kil, Jaeheung Surh, Seunghyun Park, Bado Lee, Youngmin Baek .[DEER: Detection-agnostic End-to-End Recognizer for Scene Text Spotting](https://arxiv.org/pdf/2203.05122) [J]. arXiv preprint arXiv:2203.05122.

- Chang Liu, Chun Yang, Hai-Bo Qin, Xiaobin Zhu, Cheng-Lin Liu, Xu-Cheng Yin .[Towards Open-Set Text Recognition via Label-to-Prototype Learning](https://arxiv.org/pdf/2203.05179) [J]. arXiv preprint arXiv:2203.05179.

- Fuqiang Zhao, Jionghua Yu, Enjun Xing, Wenming Song, Xue Xu .[Real-time Scene Text Detection Based on Global Level and Word Level Features](https://arxiv.org/pdf/2203.05251) [J]. arXiv preprint arXiv:2203.05251.

- Shi-Xue Zhang, Xiaobin Zhu, Jie-Bo Hou, Chun Yang, Xu-Cheng Yin .[Kernel Proposal Network for Arbitrary Shape Text Detection](https://arxiv.org/pdf/2203.06410) [J]. arXiv preprint arXiv:2203.06410.

- Xiaojie Chu, Yongtao Wang, Chunhua Shen, Jingdong Chen, Wei Chu .[Training Protocol Matters: Towards Accurate Scene Text Recognition via Training Protocol Searching](https://arxiv.org/pdf/2203.06696) [J]. arXiv preprint arXiv:2203.06696.

- Yangming Shi, Haisong Ding, Kai Chen, Qiang Huo .[APRNet: Attention-based Pixel-wise Rendering Network for Photo-Realistic Text Image Generation](https://arxiv.org/pdf/2203.07705) [J]. arXiv preprint arXiv:2203.07705.

- Jianqi Ma, Zhetong Liang, Lei Zhang .[A Text Attention Network for Spatial Deformation Robust Scene Text Image Super-resolution](https://arxiv.org/pdf/2203.09388) [J]. arXiv preprint arXiv:2203.09388.

- Mingxin Huang, Yuliang Liu, Zhenghao Peng, Chongyu Liu, Dahua Lin, Shenggao Zhu, Nicholas Yuan, Kai Ding, Lianwen Jin .[SwinTextSpotter: Scene Text Spotting via Better Synergy between Text Detection and Text Recognition](https://arxiv.org/pdf/2203.10209) [J]. arXiv preprint arXiv:2203.10209.

- Canjie Luo, Lianwen Jin, Jingdong Chen .[SimAN: Exploring Self-Supervised Representation Learning of Scene Text via Similarity-Aware Normalization](https://arxiv.org/pdf/2203.10492) [J]. arXiv preprint arXiv:2203.10492.

- Weijia Wu, Debing Zhang, Ying Fu, Chunhua Shen, Hong Zhou, Yuanqiang Cai, Ping Luo .[End-to-End Video Text Spotting with Transformer](https://arxiv.org/pdf/2203.10539) [J]. arXiv preprint arXiv:2203.10539.

- Wondimu Dikubab, Dingkang Liang, Minghui Liao, Xiang Bai .[Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition](https://arxiv.org/pdf/2203.12165) [J]. arXiv preprint arXiv:2203.12165.

- Mélodie Boillet, Christopher Kermorvant, Thierry Paquet .[Robust Text Line Detection in Historical Documents: Learning and Evaluation Methods](https://arxiv.org/pdf/2203.12346) [J]. arXiv preprint arXiv:2203.12346.

- Hao Wang, Junchao Liao, Tianheng Cheng, Zewen Gao, Hao Liu, Bo Ren, Xiang Bai, Wenyu Liu .[Knowledge Mining with Scene Text for Fine-Grained Recognition](https://arxiv.org/pdf/2203.14215) [J]. arXiv preprint arXiv:2203.14215.

- Shangbang Long, Siyang Qin, Dmitry Panteleev, Alessandro Bissacco, Yasuhisa Fujii, Michalis Raptis .[Towards End-to-End Unified Scene Text Detection and Layout Analysis](https://arxiv.org/pdf/2203.15143) [J]. arXiv preprint arXiv:2203.15143.

- Jingqun Tang, Wenqing Zhang, Hongye Liu, MingKun Yang, Bo Jiang, Guanglong Hu, Xiang Bai .[Few Could Be Better Than All: Feature Sampling and Grouping for Scene Text Detection](https://arxiv.org/pdf/2203.15221) [J]. arXiv preprint arXiv:2203.15221.

- Mengjun Cheng, Yipeng Sun, Longchao Wang, Xiongwei Zhu, Kun Yao, Jie Chen, Guoli Song, Junyu Han, Jingtuo Liu, Errui Ding, Jingdong Wang .[ViSTA: Vision and Scene Text Aggregation for Cross-Modal Retrieval](https://arxiv.org/pdf/2203.16778) [J]. arXiv preprint arXiv:2203.16778.

- Xiang Zhang, Yongwen Su, Subarna Tripathi, Zhuowen Tu .[Text Spotting Transformers](https://arxiv.org/pdf/2204.01918) [J]. arXiv preprint arXiv:2204.01918.

- Xiaojie Chu, Yongtao Wang .[IterVM: Iterative Vision Modeling Module for Scene Text Recognition](https://arxiv.org/pdf/2204.02630) [J]. arXiv preprint arXiv:2204.02630.

- Yizhi Wang, Guo Pu, Wenhan Luo, Yexin Wang, Pengfei Xiong, Hongwen Kang, Zhouhui Lian .[Aesthetic Text Logo Synthesis via Content-aware Layout Inferring](https://arxiv.org/pdf/2204.02701) [J]. arXiv preprint arXiv:2204.02701.

- Lei Kang, Pau Riba, Marçal Rusiñol, Alicia Fornés, Mauricio Villegas .[Content and Style Aware Generation of Text-line Images for Handwriting Recognition](https://arxiv.org/pdf/2204.05539) [J]. arXiv preprint arXiv:2204.05539.

- Caiyuan Zheng, Hui Li, Seon-Min Rhee, Seungju Han, Jae-Joon Han, Peng Wang .[Pushing the Performance Limit of Scene Text Recognizer without Human Annotation](https://arxiv.org/pdf/2204.07714) [J]. arXiv preprint arXiv:2204.07714.

- Gangwei Jiang, Shiyao Wang, Tiezheng Ge, Yuning Jiang, Ying Wei, Defu Lian .[Self-Supervised Text Erasing with Controllable Image Synthesis](https://arxiv.org/pdf/2204.12743) [J]. arXiv preprint arXiv:2204.12743.

- Sibo Song, Jianqiang Wan, Zhibo Yang, Jun Tang, Wenqing Cheng, Xiang Bai, Cong Yao .[Vision-Language Pre-Training for Boosting Scene Text Detectors](https://arxiv.org/pdf/2204.13867) [J]. arXiv preprint arXiv:2204.13867.

- Minyi Zhao, Miao Wang, Fan Bai, Bingjia Li, Jie Wang, Shuigeng Zhou .[C3-STISR: Scene Text Image Super-resolution with Triple Clues](https://arxiv.org/pdf/2204.14044) [J]. arXiv preprint arXiv:2204.14044.

- Yongkun Du, Zhineng Chen, Caiyan Jia, Xiaoting Yin, Tianlun Zheng, Chenxia Li, Yuning Du, Yu-Gang Jiang .[SVTR: Scene Text Recognition with a Single Visual Model](https://arxiv.org/pdf/2205.00159) [J]. arXiv preprint arXiv:2205.00159.

- Tobias Schlagenhauf, Markus Netzer, Jan Hillinger .[Text Detection on Technical Drawings for the Digitization of Brown-field Processes](https://arxiv.org/pdf/2205.02659) [J]. arXiv preprint arXiv:2205.02659.

- Aviad Aberdam, Roy Ganz, Shai Mazor, Ron Litman .[Multimodal Semi-Supervised Learning for Text Recognition](https://arxiv.org/pdf/2205.03873) [J]. arXiv preprint arXiv:2205.03873.

- Youhui Guo, Yu Zhou, Xugong Qin, Enze Xie, Weiping Wang .[UNITS: Unsupervised Intermediate Training Stage for Scene Text Detection](https://arxiv.org/pdf/2205.04683) [J]. arXiv preprint arXiv:2205.04683.

- Shi-Xue Zhang, Xiaobin Zhu, Chun Yang, Xu-Cheng Yin .[Arbitrary Shape Text Detection via Boundary Transformer](https://arxiv.org/pdf/2205.05320) [J]. arXiv preprint arXiv:2205.05320.

- Valentina Arrigoni, Luisa Repele, Dario Marino Saccavino .[TextMatcher: Cross-Attentional Neural Network to Compare Image and Text](https://arxiv.org/pdf/2205.05507) [J]. arXiv preprint arXiv:2205.05507.

- Zobeir Raisi, John Zelek .[Text Detection & Recognition in the Wild for Robot Localization](https://arxiv.org/pdf/2205.08565) [J]. arXiv preprint arXiv:2205.08565.

- Lalita Kumari, Sukhdeep Singh, Vaibhav Varish Singh Rathore, Anuj Sharma .[LexiconNet: An End-to-End Handwritten Paragraph Text Recognition System](https://arxiv.org/pdf/2205.11018) [J]. arXiv preprint arXiv:2205.11018.

- Kartik Chaudhary, Raghav Bali .[Easter2.0: Improving convolutional models for handwritten text recognition](https://arxiv.org/pdf/2205.14879) [J]. arXiv preprint arXiv:2205.14879.

- Pengyuan Lyu, Chengquan Zhang, Shanshan Liu, Meina Qiao, Yangliu Xu, Liang Wu, Kun Yao, Junyu Han, Errui Ding, Jingdong Wang .[MaskOCR: Text Recognition with Masked Encoder-Decoder Pretraining](https://arxiv.org/pdf/2206.00311) [J]. arXiv preprint arXiv:2206.00311.

- Zhenyu Hu, Zhenyu Wu, Pengcheng Pi, Yunhe Xue, Jiayi Shen, Jianchao Tan, Xiangru Lian, Zhangyang Wang, Ji Liu .[E^2VTS: Energy-Efficient Video Text Spotting from Unmanned Aerial Vehicles](https://arxiv.org/pdf/2206.02281) [J]. arXiv preprint arXiv:2206.02281.

- Ye Liu, Changchong Lu, Chen Lin, Di Yin, Bo Ren .[Contrastive Graph Multimodal Model for Text Classification in Videos](https://arxiv.org/pdf/2206.02343) [J]. arXiv preprint arXiv:2206.02343.

- Mohammad Daniyal Shaiq, Musa Dildar Ahmed Cheema, Ali Kamal .[Transformer based Urdu Handwritten Text Optical Character Reader](https://arxiv.org/pdf/2206.04575) [J]. arXiv preprint arXiv:2206.04575.

- Md. Ataur Rahman, Nazifa Tabassum, Mitu Paul, Riya Pal, Mohammad Khairul Islam .[BN-HTRd: A Benchmark Dataset for Document Level Offline Bangla Handwritten Text Recognition (HTR) and Line Segmentation](https://arxiv.org/pdf/2206.08977) [J]. arXiv preprint arXiv:2206.08977.

- Yuchen Su, Zhiwen Shao, Yong Zhou, Fanrong Meng, Hancheng Zhu, Bing Liu, Rui Yao .[TextDCT: Arbitrary-Shaped Text Detection via Discrete Cosine Transform Mask](https://arxiv.org/pdf/2206.13381) [J]. arXiv preprint arXiv:2206.13381.

- Mingkun Yang, Minghui Liao, Pu Lu, Jing Wang, Shenggao Zhu, Hualin Luo, Qi Tian, Xiang Bai .[Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition](https://arxiv.org/pdf/2207.00193) [J]. arXiv preprint arXiv:2207.00193.

- Oshri Naparstek, Ophir Azulai, Daniel Rotman, Yevgeny Burshtein, Peter Staar, Udi Barzelay .[BusiNet -- a Light and Fast Text Detection Network for Business Documents](https://arxiv.org/pdf/2207.01220) [J]. arXiv preprint arXiv:2207.01220.

- Yuzhong Zhao, Yuanqiang Cai, Weijia Wu, Weiqiang Wang .[Explore Faster Localization Learning For Scene Text Detection](https://arxiv.org/pdf/2207.01342) [J]. arXiv preprint arXiv:2207.01342.

- Nikolaj Kjøller Bjerregaard, Veronika Cheplygina, Stefan Heinrich .[Detection of Furigana Text in Images](https://arxiv.org/pdf/2207.03960) [J]. arXiv preprint arXiv:2207.03960.

- Wes Robbins, Zanyar Zohourianshahzadi, Jugal Kalita .[Towards Multimodal Vision-Language Models Generating Non-Generic Text](https://arxiv.org/pdf/2207.04174) [J]. arXiv preprint arXiv:2207.04174.

- Maoyuan Ye, Jing Zhang, Shanshan Zhao, Juhua Liu, Bo Du, Dacheng Tao .[DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer](https://arxiv.org/pdf/2207.04491) [J]. arXiv preprint arXiv:2207.04491.

- Lalita Kumari, Sukhdeep Singh, VVS Rathore, Anuj Sharma .[A Lexicon and Depth-wise Separable Convolution Based Handwritten Text Recognition System](https://arxiv.org/pdf/2207.04651) [J]. arXiv preprint arXiv:2207.04651.

- Jeonghun Baek, Yusuke Matsui, Kiyoharu Aizawa .[COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts](https://arxiv.org/pdf/2207.04675) [J]. arXiv preprint arXiv:2207.04675.

- Ying Chen, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, Xi Li .[Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting](https://arxiv.org/pdf/2207.06694) [J]. arXiv preprint arXiv:2207.06694.

- Darwin Bautista, Rowel Atienza .[Scene Text Recognition with Permuted Autoregressive Sequence Models](https://arxiv.org/pdf/2207.06966) [J]. arXiv preprint arXiv:2207.06966.

- Jingjing Wu, Pengyuan Lyu, Guangming Lu, Chengquan Zhang, Kun Yao, Wenjie Pei .[Decoupling Recognition from Detection: Single Shot Self-Reliant Scene Text Spotter](https://arxiv.org/pdf/2207.07253) [J]. arXiv preprint arXiv:2207.07253.

- Hanadi Hassen Mohammed, Junaid Malik, Somaya Al-Madeed, Serkan Kiranyaz .[2D Self-Organized ONN Model For Handwritten Text Recognition](https://arxiv.org/pdf/2207.08139) [J]. arXiv preprint arXiv:2207.08139.

- Wejia Wu, Zhuang Li, Jiahong Li, Chunhua Shen, Hong Zhou, Size Li, Zhongyuan Wang, Ping Luo .[Real-time End-to-End Video Text Spotter with Contrastive Representation Learning](https://arxiv.org/pdf/2207.08417) [J]. arXiv preprint arXiv:2207.08417.

- Dajian Zhong, Shujing Lyu, Palaiahnakote Shivakumara, Bing Yin, Jiajia Wu, Umapada Pal, Yue Lu .[SGBANet: Semantic GAN and Balanced Attention Network for Arbitrarily Oriented Scene Text Recognition](https://arxiv.org/pdf/2207.10256) [J]. arXiv preprint arXiv:2207.10256.

- Xiangcheng Du, Zhao Zhou, Yingbin Zheng, Xingjiao Wu, Tianlong Ma, Cheng Jin .[Progressive Scene Text Erasing with Self-Supervision](https://arxiv.org/pdf/2207.11469) [J]. arXiv preprint arXiv:2207.11469.

- Jingqun Tang, Wenming Qian, Luchuan Song, Xiena Dong, Lan Li, Xiang Bai .[Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning](https://arxiv.org/pdf/2207.11934) [J]. arXiv preprint arXiv:2207.11934.

- Dezhi Peng, Lianwen Jin, Weihong Ma, Canyu Xie, Hesuo Zhang, Shenggao Zhu, Jing Li .[Recognition of Handwritten Chinese Text by Segmentation: A Segment-annotation-free Approach](https://arxiv.org/pdf/2207.14801) [J]. arXiv preprint arXiv:2207.14801.

- Dezhi Peng, Lianwen Jin, Yuliang Liu, Canjie Luo, Songxuan Lai .[PageNet: Towards End-to-End Weakly Supervised Page-Level Handwritten Chinese Text Recognition](https://arxiv.org/pdf/2207.14807) [J]. arXiv preprint arXiv:2207.14807.

- Xudong Xie, Ling Fu, Zhifei Zhang, Zhaowen Wang, Xiang Bai .[Toward Understanding WordArt: Corner-Guided Transformer for Scene Text Recognition](https://arxiv.org/pdf/2208.00438) [J]. arXiv preprint arXiv:2208.00438.

- Zhangzi Zhu, Yu Hao, Wenqing Zhang, Chuhui Xue, Song Bai .[Runner-Up Solution to ECCV 2022 Challenge on Out of Vocabulary Scene Text Understanding: Cropped Word Recognition](https://arxiv.org/pdf/2208.02747) [J]. arXiv preprint arXiv:2208.02747.

- Roi Ronen, Shahar Tsiper, Oron Anschel, Inbal Lavi, Amir Markovitz, R. Manmatha .[GLASS: Global to Local Attention for Scene-Text Spotting](https://arxiv.org/pdf/2208.03364) [J]. arXiv preprint arXiv:2208.03364.

- Silvia Cascianelli, Vittorio Pippi, Martin Maarand, Marcella Cornia, Lorenzo Baraldi, Christopher Kermorvant, Rita Cucchiara .[The LAM Dataset: A Novel Benchmark for Line-Level Handwritten Text Recognition](https://arxiv.org/pdf/2208.07682) [J]. arXiv preprint arXiv:2208.07682.

- Silvia Cascianelli, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara .[Boosting Modern and Historical Handwritten Text Recognition with Deformable Convolutions](https://arxiv.org/pdf/2208.08109) [J]. arXiv preprint arXiv:2208.08109.

- Markus Glitzner, Jan-Hendrik Neudeck, Philipp Härtinger .[Shift Variance in Scene Text Detection](https://arxiv.org/pdf/2208.09231) [J]. arXiv preprint arXiv:2208.09231.

- Jingyu Lin, Jie Jiang, Yan Yan, Chunchao Guo, Hongfa Wang, Wei Liu, Hanzi Wang .[DPTNet: A Dual-Path Transformer Architecture for Scene Text Detection](https://arxiv.org/pdf/2208.09878) [J]. arXiv preprint arXiv:2208.09878.

- Abhishek Mukhopadhyay, Shubham Agarwal, Patrick Dylan Zwick, Pradipta Biswas .[To show or not to show: Redacting sensitive text from videos of electronic displays](https://arxiv.org/pdf/2208.10270) [J]. arXiv preprint arXiv:2208.10270.

- Shi-Xue Zhang, Xiaobin Zhu, Lei Chen, Jie-Bo Hou, Xu-Cheng Yin .[Arbitrary Shape Text Detection via Segmentation with Probability Maps](https://arxiv.org/pdf/2208.12419) [J]. arXiv preprint arXiv:2208.12419.

## Datasets

there are three websites that have the dataset list of some different data type:    

1 - [www.iapr-tc11.org](http://www.iapr-tc11.org/mediawiki/index.php?title=Datasets_List)    

2 - [tc11.cvc.uab.es](http://tc11.cvc.uab.es/datasets/type/)    

3 - [rrc.cvc.uab.es](http://rrc.cvc.uab.es)    

- [`2017 COCO-Text`](http://rrc.cvc.uab.es/?ch=5&com=introduction)  

  [`2017 DeTEXT`](http://rrc.cvc.uab.es/?ch=9&com=introduction)  

  [`2017 DOST`](http://rrc.cvc.uab.es/?ch=7&com=introduction)  

  [`2017 FSNS`](http://rrc.cvc.uab.es/?ch=6&com=introduction)  

  [`2017 MLT`](http://rrc.cvc.uab.es/?ch=8&com=introduction)  

  [`2017 IEHHR`](http://rrc.cvc.uab.es/?ch=10&com=introduction)    

  [`2011-2015 Born-DIgitalImage`](http://rrc.cvc.uab.es/?ch=1&com=introduction)  

  [`2013-2015 Focused Scene Text`](http://rrc.cvc.uab.es/?ch=2&com=introduction)   

  [`2013-2015 Text in Videos`](http://rrc.cvc.uab.es/?ch=3&com=introduction)  

  [`2015 Incidental Scene Text`](http://rrc.cvc.uab.es/?ch=4&com=introduction)

- [ICDAR Chinese](http://www.icdar2017chinese.site:5080/dataset/)    `2017`

  - more than 12,000 images. Most of the images are collected in the wild by phone cameras.

  - Task: Chinese Text in the Wild. 

- [`Chinese Text in the Wild`](https://ctwdataset.github.io/)    `2017`    

  - 32,285 high resolution images, 1,018,402 character instances, 3,850 character categories, 6 kinds of attributes

- [`Total-Text`](https://github.com/cs-chan/Total-Text-Dataset)  `2017`   

  - 1555 images,11459 text instances, includes curved tex

  

- [`SCUT_FORU_DB_Release`](https://github.com/HCIILAB/SCUT_FORU_DB_Release)  `2016`

  -  FORU contains two parts, which are Chinese2k and English2k dataset, respectively.

  

- [`SynthText in the Wild Dataset`](http://www.robots.ox.ac.uk/~vgg/data/scenetext/)   `2016`

  -  800 thousand images, 8 million synthetic word instances. 

  -  Each text instance is annotated with its text-string, word-level and character-level bounding-boxes.

  

- [`COCO-Text (Computer Vision Group, Cornell)`](http://vision.cornell.edu/se3/coco-text/)   `2016`

  - 63,686 images, 173,589 text instances, 3 fine-grained text attributes.

  - Task: text location and recognition

  - [`COCO-Text API`](https://github.com/andreasveit/coco-text)

- [`USTB-SV1k`](http://prir.ustb.edu.cn/TexStar/MOMV-text-detection/)   `2014`

  - 1000 (500 for training and 500 for testing) street view (patch) images from 6 USA cities

- [`Synthetic Word Dataset (Oxford, VGG)`](http://www.robots.ox.ac.uk/~vgg/data/text/)   `2014`

  - 9 million images covering 90k English words

  - Task: text recognition, segmantation

  - [`download`](http://www.robots.ox.ac.uk/~vgg/data/text/mjsynth.tar.gz)

- [`IIIT 5K-Words`](http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K.html)   `2012`

  - 5000 images from Scene Texts and born-digital (2k training and 3k testing images)

  - Each image is a cropped word image of scene text with case-insensitive labels

  - Task: text recognition

  - [`download`](http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K-Word_V3.0.tar.gz)

- [`StanfordSynth(Stanford, AI Group)`](http://cs.stanford.edu/people/twangcat/#research)   `2012`

  - Small single-character images of 62 characters (0-9, a-z, A-Z)

  - Task: text recognition

  - [`download`](http://cs.stanford.edu/people/twangcat/ICPR2012_code/syntheticData.tar)

- [`MSRA Text Detection 500 Database (MSRA-TD500)`](http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_(MSRA-TD500))   `2012`

  - 500 natural images(resolutions of the images vary from 1296x864 to 1920x1280)

  - Chinese, English or mixture of both

  - Task: text detection

- [`OSTD`](http://media-lab.ccny.cuny.edu/wordpress/cyi/project_scenetextdetection.html)  `2011`

  - cannot find the downloadlink

  

- [`Traffice Guide Panel Text Dataset,TGPT`](http://media-lab.ccny.cuny.edu/wordpress/datecode/)   `2016`

  - 3841 high-resolution individual images, 2315 containing traffic guide panel level annotations (1911 for training and 404 for testing, and all the testing images are manually labeled with ground truth tight text region bounding boxes), 1526 containing no traffic signs}.

- [`Street View Text (SVT)`](http://tc11.cvc.uab.es/datasets/SVT_1)   `2010`

  - 350 high resolution images (average size 1260 × 860) (100 images for training and 250 images for testing)

  - Only word level bounding boxes are provided with case-insensitive labels

  - Task: text location

- [`KAIST Scene_Text Database`](http://www.iapr-tc11.org/mediawiki/index.php/KAIST_Scene_Text_Database)   `2010`

  - 3000 images of indoor and outdoor scenes containing text

  - Korean, English (Number), and Mixed (Korean + English + Number)

  - Task: text location, segmantation and recognition

- [`Chars74k`](http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/)   `2009`

  - Over 74K images from natural images, as well as a set of synthetically generated characters 

  - Small single-character images of 62 characters (0-9, a-z, A-Z)

  - Task: text recognition

- `ICDAR Benchmark Datasets`

|Dataset| Discription | Competition Paper |

|---|---|----

|[ICDAR 2015](http://rrc.cvc.uab.es/)| 1000 training images and 500 testing images|`paper`  [![link](https://www.lds.org/bc/content/shared/content/images/gospel-library/manual/10735/paper-icon_1150845_tmb.jpg)](http://rrc.cvc.uab.es/files/Robust-Reading-Competition-Karatzas.pdf)|

|[ICDAR 2013](http://dagdata.cvc.uab.es/icdar2013competition/)| 229 training images and 233 testing images |`paper`  [![link](https://www.lds.org/bc/content/shared/content/images/gospel-library/manual/10735/paper-icon_1150845_tmb.jpg)](http://dagdata.cvc.uab.es/icdar2013competition/files/icdar2013_competition_report.pdf)|

|[ICDAR 2011](http://robustreading.opendfki.de/trac/)| 229 training images and 255 testing images |`paper`  [![link](https://www.lds.org/bc/content/shared/content/images/gospel-library/manual/10735/paper-icon_1150845_tmb.jpg)](http://www.iapr-tc11.org/archive/icdar2011/fileup/PDF/4520b491.pdf)|

|[ICDAR 2005](http://www.iapr-tc11.org/mediawiki/index.php/ICDAR_2005_Robust_Reading_Competitions)| 1001 training images and 489 testing images |`paper`  [![link](https://www.lds.org/bc/content/shared/content/images/gospel-library/manual/10735/paper-icon_1150845_tmb.jpg)](http://www.academia.edu/download/30700479/10.1.1.96.4332.pdf)|

|[ICDAR 2003](http://www.iapr-tc11.org/mediawiki/index.php/ICDAR_2003_Robust_Reading_Competitions)| 181 training images and 251 testing images(word level and character level) |`paper`  [![link](https://www.lds.org/bc/content/shared/content/images/gospel-library/manual/10735/paper-icon_1150845_tmb.jpg)](http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.332.3461&rep=rep1&type=pdf)|
ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/ChanChiChoi/awesome-ocr

Awesome Lists containing this project

README