{"id":24087665,"url":"https://github.com/xinke-wang/ocrdatasets","last_synced_at":"2026-03-02T08:32:48.714Z","repository":{"id":189863466,"uuid":"533652787","full_name":"xinke-wang/OCRDatasets","owner":"xinke-wang","description":"A collection of OCR-related datasets","archived":false,"fork":false,"pushed_at":"2022-09-07T09:57:06.000Z","size":20,"stargazers_count":150,"open_issues_count":0,"forks_count":5,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-02-27T04:48:03.831Z","etag":null,"topics":["datasets","documents","ocr","scene-text-detection","scene-text-recognition"],"latest_commit_sha":null,"homepage":"","language":null,"has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/xinke-wang.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null}},"created_at":"2022-09-07T07:21:05.000Z","updated_at":"2025-02-21T11:46:17.000Z","dependencies_parsed_at":"2023-08-22T05:05:06.217Z","dependency_job_id":null,"html_url":"https://github.com/xinke-wang/OCRDatasets","commit_stats":null,"previous_names":["xinke-wang/ocrdatasets"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/xinke-wang/OCRDatasets","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/xinke-wang%2FOCRDatasets","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/xinke-wang%2FOCRDatasets/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/xinke-wang%2FOCRDatasets/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/xinke-wang%2FOCRDatasets/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/xinke-wang","download_url":"https://codeload.github.com/xinke-wang/OCRDatasets/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/xinke-wang%2FOCRDatasets/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":29995912,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-03-02T01:47:34.672Z","status":"online","status_checked_at":"2026-03-02T02:00:07.342Z","response_time":60,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["datasets","documents","ocr","scene-text-detection","scene-text-recognition"],"created_at":"2025-01-10T03:27:57.665Z","updated_at":"2026-03-02T08:32:48.683Z","avatar_url":"https://github.com/xinke-wang.png","language":null,"funding_links":[],"categories":[],"sub_categories":[],"readme":"# OCR Datasets\n\nThis repo collects OCR-related datasets. In general, the datasets are classified by 6 types, *i.e.*, **Natural Scene Text**, **Document Text**, **Handwritten Text**, **Historical Document Text**, **Video Text**, and **Synthetic Text**.\n\n\n\u003cdiv align=\"center\"\u003e\n\n![OCR Dataset Type](https://user-images.githubusercontent.com/45810070/188843040-e8d95f94-ef00-406d-b470-2ca83fa0d3cd.png)\n\n\u003c/div\u003e\n\n- **Natural Scene Text**: The images in this type of dataset are usually taken in natural scenes, so the difficulty of this task lies in the complex lighting transformations, shooting angles, blurring, varied fonts, etc.\n- **Document Text**: only focues on document images, the difficulty is the variety of typesetting.\n- **Historical Document Text**: is usally designed for assisting social science research. For example, digitized antiquarian documents help preserve historical materials and facilitate scholars to conduct related research.\n- **Video Text**: aims at recognizing texts in videos, which introduces temporal information into the OCR task.\n- **Synthetic Text**: synthetically generates images containing texts and the corresponding annotations by rendering texts of different fonts into natural photos. This type of dataset usually includes hundreds of thousands of samples since it does not require human beings to annotate the images. However, due to the limited technology, there is usually a large domain gap between the synthetic images and authentic samples; these datasets are often employed for pre-training only.\n\n\u003ctable\u003e\n\u003cthead\u003e\n  \u003ctr\u003e\n    \u003cth colspan=\"13\"\u003eNatural Scene Text\u003c/th\u003e\n  \u003c/tr\u003e\n\u003c/thead\u003e\n\u003ctbody\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003eYear/Venue\u003c/td\u003e\n    \u003ctd\u003eName\u003c/td\u003e\n    \u003ctd\u003eTask\u003c/td\u003e\n    \u003ctd\u003e#Train(#wds)\u003c/td\u003e\n    \u003ctd\u003e#Val(#wds)\u003c/td\u003e\n    \u003ctd\u003e#Test(#wds)\u003c/td\u003e\n    \u003ctd\u003eGranu.\u003c/td\u003e\n    \u003ctd\u003eAnno. Form\u003c/td\u003e\n    \u003ctd\u003eLanguage\u003c/td\u003e\n    \u003ctd\u003eScene\u003c/td\u003e\n    \u003ctd\u003ePaper\u003c/td\u003e\n    \u003ctd\u003eSize\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2003-05/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.iapr-tc11.org/mediawiki/index.php?title=ICDAR_2003_Robust_Reading_Competitions\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIC03/IC05\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e258 (1110)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e251 (1156)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=1227749\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e112MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2011-15/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=1\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eBorn-DIgital-Image (IC2011-2015)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Seg.\u003c/td\u003e\n    \u003ctd\u003e410 (3564)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e141 (1439)\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Pixel\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural/Web/Email\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.cvc.uab.es/icdar2011competition/images/Report_RobustReading_Challenge1_final.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e40MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2013-15/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=2\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eFocused Scene Text (IC13)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Seg.\u003c/td\u003e\n    \u003ctd\u003e229 (848)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e233 (1095)\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Pixel\u003c/td\u003e\n    \u003ctd\u003eRect [x1, y1, x2, y2, \"transcript\"] \u0026amp; SegMap\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://dagdata.cvc.uab.es/icdar2013competition/files/icdar2013_competition_report.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e250MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2015/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=4\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIncidental Scene Text (IC15)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1,000 (4468)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e500 (2077)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/files/short_rrc_2015.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e130MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=8\u0026com=introduction\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMulti-Lingual Scene Text (MLT2017)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e7,200\u003c/td\u003e\n    \u003ctd\u003e1,800\u003c/td\u003e\n    \u003ctd\u003eprivate\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, Lan, 'trans']\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e12GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=15\u0026com=introduction\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMulti-Lingual Scene Text (MLT2019)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, Lan, 'trans']\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1907.00945.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~12GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://bgshih.github.io/cocotext/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eCOCO-Text v2.0\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e43,686\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; NonEn\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e13GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=12\u0026com=downloads\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eReCTS\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e20,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e5,000\u003c/td\u003e\n    \u003ctd\u003eWord/Line\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eSignboard\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e~2.5GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/cs-chan/Total-Text-Dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eTotal-Text\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1255\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e300\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Pixel\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1710.10400.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e441MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/PR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/Yuliang-Liu/Curve-Text-Detector\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSCUT-CTW1500\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e500\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Ch\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1712.02170.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e800MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=14\u0026com=introduction\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eArbitrary-Shaped Text (ART)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e5,603 (50,029)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e4,563 (52,631)\u003c/td\u003e\n    \u003ctd\u003eWord(En)/Line(CH)\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], Lan, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Ch\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e4.4GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://rctw.vlrlab.net/dataset/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eRCTW-17 (CTW-12k)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e11514\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e1000\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eMixture\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1708.09585.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e11GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR/ICCV\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=16\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eLarge-scale Street View Text (LSVT)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e30,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e20,000\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Ch\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://openaccess.thecvf.com/content_ICCV_2019/papers/Sun_Chinese_Street_View_Text_Large-Scale_Chinese_Text_Reading_With_Partially_ICCV_2019_paper.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e14GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2016/DAS\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/lluisgomez/script_identification\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMLe2e\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Script Identifica.\u003c/td\u003e\n    \u003ctd\u003e450\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e261\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRect [x1, y1, x2, y2, language] \u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1602.07480.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e82MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://cvit.iiit.ac.in/research/projects/cvit-projects/iiit-ilst\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIIIT-ILST\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e893\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eIndic\u003c/td\u003e\n    \u003ctd\u003eGoogle Images\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=8270315\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e609MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/CVPRW\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://s3-us-west-2.amazonaws.com/uber-common-public/ubertext/index.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eUberText\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e117,969 (571,534)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://sunw.csail.mit.edu/abstract/uberText.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e197GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2009/VISAPP\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eChars74k\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1922\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eCharacter\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Kanada\u003c/td\u003e\n    \u003ctd\u003eNatural Scene\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://personal.ee.surrey.ac.uk/Personal/T.Decampos/papers/decampos_etal_visapp2009.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e739MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2010/ICPR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.iapr-tc11.org/mediawiki/index.php/KAIST_Scene_Text_Database\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eKAIST\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Seg.\u003c/td\u003e\n    \u003ctd\u003e3000\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word \u0026amp; Pixel\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"] \u0026amp; SegMap\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Korean\u003c/td\u003e\n    \u003ctd\u003eMixture\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://milab.snu.ac.kr/pub/ICPR2010.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e364MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2010/ECCV\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://vision.ucsd.edu/~kai/svt/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSVT\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e100 (211)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e250 (514)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://vision.ucsd.edu/~kai/pubs/wang_eccv2010.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e118MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2013/ICCV\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://pan.baidu.com/s/1rhYUn1mIo8OZQEGUZ9Nmrg\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSVTP (download code:vnis)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e238 (639)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/document/6751180/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~1MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2011/NIPSw\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://ufldl.stanford.edu/housenumbers/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSVHN\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e73,257+531,131\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e26,032\u003c/td\u003e\n    \u003ctd\u003eCharacter\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eDigit\u003c/td\u003e\n    \u003ctd\u003eHouse Number\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://storage.googleapis.com/pub-tools-public-publication-data/pdf/37648.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~3GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2011/ICDARw\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.iapr-tc11.org/mediawiki/index.php?title=NEOCR:_Natural_Environment_OCR_Dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eNEOCR\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet.\u003c/td\u003e\n    \u003ctd\u003e659 (5,238)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eNatural Scene\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.iapr-tc11.org/dataset/NEOCR/cbdar_paper.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e1.3GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2012/CVPR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://pages.ucsd.edu/%7Eztu/publication/MSRA-TD500.zip\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMSRA-TD500\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet.\u003c/td\u003e\n    \u003ctd\u003e300\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e200\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eRotRect [ind, difficult, x, y, w, h, theta]\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://pages.ucsd.edu/~ztu/publication/cvpr12_textdetection.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e96MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2012/BMVC\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://pages.ucsd.edu/%7Eztu/publication/MSRA-TD500.zip\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIIIT 5k-word\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e380 (2000)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e740 (3000)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://cvit.iiit.ac.in/projects/SceneTextUnderstanding/IIIT5K.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e106MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2014/ESWA\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://cs-chan.com/downloads_CUTE80_dataset.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eCUTE80\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e80\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]]]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://cs-chan.com/doc/ESWA_2014A.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e44MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2015/TPAMI\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://prir.ustb.edu.cn/TexStar/MOMV-text-detection/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eUSTB-SV1K\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e500\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e500\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRotRect [ind, difficult, x, y, w, h, theta, \"trans\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=7001081\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e36MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/JCST\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ctwdataset.github.io/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eChinese Text in the Wild (CTW)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e25,887(812,872chrs)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e3,269(103,519chrs)\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1803.00085.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~40GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/TITS\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/chongshengzhang/shopsign\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eShopSign\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1258 sample images\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eSignboard\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/document/9186709\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e3GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/CVPR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://textvqa.org/textocr\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eTextOCR\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; VQA\u003c/td\u003e\n    \u003ctd\u003e24902 (822,572)\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e3232 (80,497)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural Scene\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/2105.05486.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~8GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/CVPR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/VinAIResearch/dict-guided#dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eVinText\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1,200\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e300+500\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eVietnamese\u003c/td\u003e\n    \u003ctd\u003eNatural Scene\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www3.cs.stonybrook.edu/~minhhoai/papers/vintext_CVPR21.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e1GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2018/Competition\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://tianchi.aliyun.com/competition/entrance/231685/introduction\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eICPR MTWI2018\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Ch\u003c/td\u003e\n    \u003ctd\u003eWEB Images\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=8546143\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e2GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/Competition\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://aistudio.baidu.com/aistudio/competition/detail/20\" target=\"_blank\" rel=\"noopener noreferrer\"\u003e百度中文场景文字识别比赛\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e50,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e[h, w, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Ch\u003c/td\u003e\n    \u003ctd\u003eStreet View\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"13\"\u003eDocument Text\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003eYear/Venue\u003c/td\u003e\n    \u003ctd\u003eName\u003c/td\u003e\n    \u003ctd\u003eTask\u003c/td\u003e\n    \u003ctd\u003e#Train\u003c/td\u003e\n    \u003ctd\u003e#Val\u003c/td\u003e\n    \u003ctd\u003e#Test\u003c/td\u003e\n    \u003ctd\u003eGranu.\u003c/td\u003e\n    \u003ctd\u003eAnno. Form\u003c/td\u003e\n    \u003ctd\u003eLanguage\u003c/td\u003e\n    \u003ctd\u003eScene\u003c/td\u003e\n    \u003ctd\u003ePaper\u003c/td\u003e\n    \u003ctd\u003eSize\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2011/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://ciir.cs.umass.edu/downloads/ocr-evaluation/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eRETAS\u003c/a\u003e\u003c/td\u003e\n    \u003ctd colspan=\"4\"\u003eNo public download link\u0026nbsp;\u0026nbsp;\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word\u003c/td\u003e\n    \u003ctd\u003eNo public download link\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2013/IJDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.lrde.epita.fr/wiki/Olena/DatasetDBD\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eLRDE-DBD Document Binarization\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Binarization\u003c/td\u003e\n    \u003ctd\u003e125\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eLine \u0026amp; Mask\u003c/td\u003e\n    \u003ctd\u003eRect\u003c/td\u003e\n    \u003ctd\u003eFrench\u003c/td\u003e\n    \u003ctd\u003eMagzine\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.lrde.epita.fr/wiki/Olena/DatasetDBD\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~700MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2015/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://smartdoc.univ-lr.fr/smartdoc-2015-challenge-2-mobile-ocr-competition/smartdoc-2015-challenge-2-dataset/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSmartDOC\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e3630\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e8470\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.cvc.uab.es/~marcal/pdfs/ICDAR15e.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~30GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2016/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/rahmad77/KPTI\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eKPTI\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e11,910\u003c/td\u003e\n    \u003ctd\u003e2,552\u003c/td\u003e\n    \u003ctd\u003e2,553\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e['transcripts']\u003c/td\u003e\n    \u003ctd\u003ePashto\u003c/td\u003e\n    \u003ctd\u003eDocument\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=7814106\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~100MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=9\u0026com=introduction\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eDeText\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e100\u003c/td\u003e\n    \u003ctd\u003e100\u003c/td\u003e\n    \u003ctd\u003e300\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eScientific\u003cbr\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0126200\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e10MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=13\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSROIE\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Info Ext.\u003c/td\u003e\n    \u003ctd\u003e600\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e400\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eReceipt\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u0026lt;1GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://guillaumejaume.github.io/FUNSD/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eFUNSD\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Info Ext.\u003c/td\u003e\n    \u003ctd\u003e149\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e50\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRect [x1, y1, x2, y2, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eForm\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1905.13538.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e16MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/herobd/NAF_dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eNAF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Info Ext.\u003c/td\u003e\n    \u003ctd\u003e682\u003c/td\u003e\n    \u003ctd\u003e59\u003c/td\u003e\n    \u003ctd\u003e63\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eForm\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8977962\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/ricardobnjunior/Brazilian-Identity-Document-Dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eBID\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e28880\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003ePoly\u003c/td\u003e\n    \u003ctd\u003eLatin\u003c/td\u003e\n    \u003ctd\u003eID Document\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ISCSIC\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/machine-intelligence-laboratory/DDI-100\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eDDI-100\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd colspan=\"2\"\u003e~ 100,000 (70% train, 30% val)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word \u0026amp; Mask\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eDistorted Document\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/ftp/arxiv/papers/1912/1912.11658.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~300GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"13\"\u003eHandwritten Text\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003eYear/Venue\u003c/td\u003e\n    \u003ctd\u003eName\u003c/td\u003e\n    \u003ctd\u003eTask\u003c/td\u003e\n    \u003ctd\u003e#Train\u003c/td\u003e\n    \u003ctd\u003e#Val\u003c/td\u003e\n    \u003ctd\u003e#Test\u003c/td\u003e\n    \u003ctd\u003eGranu.\u003c/td\u003e\n    \u003ctd\u003eAnno. Form\u003c/td\u003e\n    \u003ctd\u003eLanguage\u003c/td\u003e\n    \u003ctd\u003eScene\u003c/td\u003e\n    \u003ctd\u003ePaper\u003c/td\u003e\n    \u003ctd\u003eSize\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2008-11/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.a2ialab.com/doku.php?id=rimes_database:start\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eRIMES\u003c/a\u003e\u003c/td\u003e\n    \u003ctd colspan=\"4\"\u003eNo public download link\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Line\u003c/td\u003e\n    \u003ctd colspan=\"5\"\u003eNo public download link\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2010/DAS\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.iapr-tc11.org/mediawiki/index.php/Harbin_Institute_of_Technology_Opening_Recognition_Corpus_for_Chinese_Characters_(HIT-OR3C)\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eHIT-OR3C\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd colspan=\"3\"\u003eChar set 832,650 chars / Doc set 77,168 chars\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003especial format\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://dl.acm.org/doi/pdf/10.1145/1815330.1815359\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e1GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2012/PR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://khatt.ideas2serve.net/index.php\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eKHATT\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e8,368\u003c/td\u003e\n    \u003ctd\u003e1,793\u003c/td\u003e\n    \u003ctd\u003e1,822\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n    \u003ctd\u003e['transcripts']\u003c/td\u003e\n    \u003ctd\u003eArabic\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.sciencedirect.com/science/article/pii/S0031320313003300\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e98-2014\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://web.tuat.ac.jp/~nakagawa/database/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eHANDS\u003c/a\u003e\u003c/td\u003e\n    \u003ctd colspan=\"6\"\u003eNo public download link\u003c/td\u003e\n    \u003ctd\u003eJapanese\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://web.tuat.ac.jp/~nakagawa/database/Lao/abt.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eLao-SABAIDEE\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e500 SAMPLES\u003c/td\u003e\n    \u003ctd colspan=\"5\"\u003eNo public download link\u0026nbsp;\u0026nbsp;\u003c/td\u003e\n    \u003ctd\u003eLaos\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2014/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.orand.cl/icfhr2014-hdsr/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eORAND-CAR/CVL\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e5,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e5,000\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003e['image_name', 'trans']\u003c/td\u003e\n    \u003ctd\u003eDigits\u003c/td\u003e\n    \u003ctd\u003eHandwritten Digits\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6981115\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e194MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2018/ICFHR\u003c/td\u003e\n    \u003ctd\u003eVNOnDB\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd colspan=\"3\"\u003e1,146 paragraphs 7,296 lines\u003cbr\u003e380,000 chars\u003c/td\u003e\n    \u003ctd\u003eWord/Line/Parag.\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'trans']\u003c/td\u003e\n    \u003ctd\u003eVietnamese\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=8583810\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e200MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2013-16/IJDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/callee2006/HangulDB\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePE92/SERI95/HanDB (HangulDB)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd colspan=\"3\"\u003e1200 samples (90% Train/10% Test)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e.HGU1 format\u003c/td\u003e\n    \u003ctd\u003eKorean\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/article/10.1007/s10032-014-0229-4\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e800MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e95-2016\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.nist.gov/srd/nist-special-database-19\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eNIST\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2011/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.nlpr.ia.ac.cn/databases/handwriting/Home.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eCASIA-OLHWDB/HWDB\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.nlpr.ia.ac.cn/databases/download/ICDAR2011-CASIA%20databases.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://cvit.iiit.ac.in/research/projects/cvit-projects/iiit-indic-hw-words\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIIT-INDIC-HW-WORDS\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e872,000 instances\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003e['image_name', 'vocab_id'] \u0026amp; vocabularly\u003c/td\u003e\n    \u003ctd\u003eIndic\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://cvit.iiit.ac.in/images/ConferencePapers/2021/iiit-indic-hw-words.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~20GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e1999/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://fki.tic.heia-fr.ch/databases/iam-handwriting-database\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIAM Handwriting Database\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e6,161\u003c/td\u003e\n    \u003ctd\u003e900+940\u003c/td\u003e\n    \u003ctd\u003e1,861\u003c/td\u003e\n    \u003ctd colspan=\"6\"\u003eRegistration is Required\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2005/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://fki.tic.heia-fr.ch/databases/iam-on-line-handwriting-database\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIAM ONLINE Handwritting Data\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e86,272 word instances\u003c/td\u003e\n    \u003ctd colspan=\"8\"\u003eRegistration is Required\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2018/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://fki.tic.heia-fr.ch/databases/iam-online-document-database\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIAM-MonDo\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd colspan=\"7\"\u003eRegistration is Required\u0026nbsp;\u0026nbsp;\u0026nbsp;\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://dl.acm.org/doi/pdf/10.1145/1815330.1815343\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2011-14/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.iapr-tc11.org/mediawiki/index.php?title=CROHME:_Competition_on_Recognition_of_Online_Handwritten_Mathematical_Expressions\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eCHROME\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e\u0026gt; 10,000 expressions\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003esymbol \u0026amp; expression\u003c/td\u003e\n    \u003ctd\u003einkml format, latex\u003c/td\u003e\n    \u003ctd\u003eSymbol\u003c/td\u003e\n    \u003ctd\u003eMathematical\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://hal.archives-ouvertes.fr/file/index/docid/865627/filename/ICDAR_2013_CROHME.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e58MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ufal.mff.cuni.cz/muscima\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMUSICMA++\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e140\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eSymbol\u003c/td\u003e\n    \u003ctd\u003eMusic Notation\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/abs/1703.04824\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2018/Access\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/HCIILAB/SCUT-EPT_Dataset_Release\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSCUT-EPT\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e40,000\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eEducational Doc.\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/document/8565866\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e1.08GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.cs.bgu.ac.il/~berat/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eHHD\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e3965\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e1134\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eHebrew\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.cs.bgu.ac.il/~berat/papers/icfhr2020_the_hhd_dataset.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ArXiv\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/facebookresearch/IMGUR5K-Handwriting-Dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIMGUR5K\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e(~108,000)\u003c/td\u003e\n    \u003ctd\u003e(~13,000)\u003c/td\u003e\n    \u003ctd\u003e(~14,000)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eHandwritten\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/2106.08385.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e-\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ArXiv\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/2101.07542.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eVML-MOC\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eSeg. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eHebrew\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/2101.07542.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.kaggle.com/c/bengaliai-cv19/data\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eBengali\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eBengali\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/abs/2010.00170\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://goodnotes.com/gnhk/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eGNHK\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e687\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/chapter/10.1007/978-3-030-86337-1_27\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"13\"\u003eHistorical Document Text\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003eYear/Venue\u003c/td\u003e\n    \u003ctd\u003eName\u003c/td\u003e\n    \u003ctd\u003eTask\u003c/td\u003e\n    \u003ctd\u003e#Train\u003c/td\u003e\n    \u003ctd\u003e#Val\u003c/td\u003e\n    \u003ctd\u003e#Test\u003c/td\u003e\n    \u003ctd\u003eGranu.\u003c/td\u003e\n    \u003ctd\u003eAnno. Form\u003c/td\u003e\n    \u003ctd\u003eLanguage\u003c/td\u003e\n    \u003ctd\u003eScene\u003c/td\u003e\n    \u003ctd\u003ePaper\u003c/td\u003e\n    \u003ctd\u003eSize\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2010-11/DAS\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://fki.tic.heia-fr.ch/databases/iam-historical-document-database\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIAM-HistDB\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e127\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Line\u003c/td\u003e\n    \u003ctd\u003e['image_id', 'transcript']\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; Ger \u0026amp; Latin\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u0026gt;200mb\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2016/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.prhlt.upv.es/contests/icfhr2016-kws/data.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eH-KWS (1. Botany 2. AK)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e1849\u003c/td\u003e\n    \u003ctd\u003e3734\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Line\u003c/td\u003e\n    \u003ctd\u003eRect [x, y, w, h, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/document/7814133\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2016/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://zenodo.org/record/1297399#.YUFmxHvhUXU\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eREAD\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRegistration is Required\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eGerman\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/document/7814136\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~600mb\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://amadi.univ-lr.fr/ICDAR2017_Competition/index.php/dataset\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePalm Leaf Manuscript\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd colspan=\"3\"\u003e~19,000 Balinese + ~20,000 Khmer\u003c/td\u003e\n    \u003ctd\u003eChar\u003c/td\u003e\n    \u003ctd\u003eNo public download link\u003c/td\u003e\n    \u003ctd\u003eKhmer\u003c/td\u003e\n    \u003ctd\u003ePalm Leaf\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/HIP\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/donavaly/SleukRith-Set\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSleukRith-Set\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e658\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word\u003c/td\u003e\n    \u003ctd\u003ePolygon [[[x1,y1], [x2,y2], ..., [xn, yn]], 'transcript']\u003c/td\u003e\n    \u003ctd\u003eKhmer\u003c/td\u003e\n    \u003ctd\u003ePalm Leaf\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://dl.acm.org/doi/10.1145/3151509.3151510\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e1GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/NCA\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ardisdataset.github.io/ARDIS/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eARDIS\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e10,000\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word\u003c/td\u003e\n    \u003ctd\u003e['transcript']\u003c/td\u003e\n    \u003ctd\u003eDigits\u003c/td\u003e\n    \u003ctd\u003eChurch Records\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/article/10.1007/s00521-019-04163-3\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.cs.bgu.ac.il/~berat/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePinkas\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord \u0026amp; Line\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eHebrew\u003c/td\u003e\n    \u003ctd\u003ehistorical manuscripts\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=8978129\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e~50MB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eCuneiform\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://patrec.cs.tu-dortmund.de/pubs/papers/Rusakov2020-TQX\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/HCIILAB/MTHv2_Datasets_Release\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMTHv2\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e2,399\u003c/td\u003e\n    \u003ctd\u003eN/A\u003c/td\u003e\n    \u003ctd\u003e800\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Line\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eAcient Book\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=9257624\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e4.6GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://morphoboid.labri.fr/ihr-nom.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIHR-NomDB\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e267\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eRect [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eChuNom\u003c/td\u003e\n    \u003ctd\u003eAcient Book\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/chapter/10.1007/978-3-030-86334-0_6#Sec3\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.cs.bgu.ac.il/~berat/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eVML-HP\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eHebrew\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/content/pdf/10.1007%2F978-3-030-86337-1_14.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.cs.bgu.ac.il/~berat/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eVML-AHTE\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/2101.08299.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2019/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://ihdia.iiit.ac.in/indiscapes/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eIndiScapes\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eSeg\u003c/td\u003e\n    \u003ctd\u003eNo public download link\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eIndic\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1912.07025.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"13\"\u003eVideo Text\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003eYear/Venue\u003c/td\u003e\n    \u003ctd\u003eName\u003c/td\u003e\n    \u003ctd\u003eTask\u003c/td\u003e\n    \u003ctd\u003e#TrainVids (#frames)\u003c/td\u003e\n    \u003ctd\u003e#ValVids (#f)\u003c/td\u003e\n    \u003ctd\u003e#TestVids(#f)\u003c/td\u003e\n    \u003ctd\u003eGranu.\u003c/td\u003e\n    \u003ctd\u003eAnno. Form\u003c/td\u003e\n    \u003ctd\u003eLanguage\u003c/td\u003e\n    \u003ctd\u003eScene\u003c/td\u003e\n    \u003ctd\u003ePaper\u003c/td\u003e\n    \u003ctd\u003eSize\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2013/15/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=3\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eText in Videos (IC13)\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e25 (13450)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e24 (14374)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eNatural\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://dagdata.cvc.uab.es/icdar2013competition/files/icdar2013_competition_report.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2015/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://www.ict.griffith.edu.au/cvsi2015/Dataset.php\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eCVSI2015\u003c/a\u003e\u003c/td\u003e\n    \u003ctd colspan=\"6\"\u003eNo public link for download\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=\u0026arnumber=7333950\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2017/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://rrc.cvc.uab.es/?ch=7\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eDOST\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003eQUAD\u003c/td\u003e\n    \u003ctd\u003eJapanese\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2018/ICFHR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://cvit.iiit.ac.in/research/projects/cvit-projects/lecturevideodb\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eLectureVideoDB\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e-52,225\u003c/td\u003e\n    \u003ctd\u003e-27,900\u003c/td\u003e\n    \u003ctd\u003e-36,460\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eSlides/Paper\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/document/8583767\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e2.3GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ICRA\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"http://cvit.iiit.ac.in/research/projects/cvit-projects/roadtext-1k\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eRoadText-1K\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e500 (150,000)\u003c/td\u003e\n    \u003ctd\u003e200 (60,000)\u003c/td\u003e\n    \u003ctd\u003e300 (90,000)\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eRect [x1, y1, x2, y2, \"transcript\"] \u0026amp; SegMap\u003c/td\u003e\n    \u003ctd\u003eEn \u0026amp; NonEn\u003c/td\u003e\n    \u003ctd\u003eRoad/Traffic\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=9196577\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ICMV\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/fcakyon/midv500\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMIDV-500 \u0026amp; MIDV-2019\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Others\u003c/td\u003e\n    \u003ctd\u003e500 video clips\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eDocument\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.spiedigitallibrary.org/conference-proceedings-of-spie/11433/2558438/MIDV-2019--challenges-of-the-modern-mobile-based-document/10.1117/12.2558438.full?SSO=1\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e32GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"ftp://smartengines.com/midv-lait/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eMIDV-LAIT\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec. \u0026amp; Others\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003eDocument\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/chapter/10.1007/978-3-030-86331-9_17#Sec3\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020/ICPR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://diuf.unifr.ch/main/diva/AcTiVComp/evaluation.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eAcTiVComp\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e2557 frames\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eLine\u003c/td\u003e\n    \u003ctd\u003eRect [x1, y1, x2, y2, \"transcript\"]\u003c/td\u003e\n    \u003ctd\u003eArabic\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"13\"\u003eSynthetic Text\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003eYear/Venue\u003c/td\u003e\n    \u003ctd\u003eName\u003c/td\u003e\n    \u003ctd\u003eTask\u003c/td\u003e\n    \u003ctd\u003e#Train\u003c/td\u003e\n    \u003ctd\u003e#Val\u003c/td\u003e\n    \u003ctd\u003e#Test\u003c/td\u003e\n    \u003ctd\u003eGranu.\u003c/td\u003e\n    \u003ctd\u003eAnno. Form\u003c/td\u003e\n    \u003ctd\u003eLanguage\u003c/td\u003e\n    \u003ctd\u003eScene\u003c/td\u003e\n    \u003ctd\u003ePaper\u003c/td\u003e\n    \u003ctd\u003eSize\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2016/CVPR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://www.robots.ox.ac.uk/~vgg/data/scenetext/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSynth800k\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e858,750 (7,266,866)\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChar \u0026amp; Word \u0026amp; Line\u003c/td\u003e\n    \u003ctd\u003eQuad [x1, y1, x2, y2, x3, y3, x4, y4, 'trans']\u003c/td\u003e\n    \u003ctd\u003eEnglish\u003c/td\u003e\n    \u003ctd\u003eSynthetic\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://arxiv.org/pdf/1604.06646.pdf\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e41GB\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2020\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://jyouhou.github.io/UnrealText/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eUnrealText\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd colspan=\"3\"\u003e728,000 En + 674,000 others\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003emulti-lingual\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/YCG09/chinese_ocr\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eChinese_ocr\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eDet. \u0026amp; Rec.\u003c/td\u003e\n    \u003ctd\u003e~ 364 million\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eChinese\u003c/td\u003e\n    \u003ctd\u003eDocument\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://tukl.seecs.nust.edu.pk/downloads.html\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eUPTI\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003eUrdu\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e-\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://diuf.unifr.ch/main/diva/APTI/\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eAPTI\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd colspan=\"3\"\u003e45313600 (\u0026gt; 250 million chars)\u003c/td\u003e\n    \u003ctd\u003eWord\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003earabic\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/clovaai/synthtiger\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eSynthTiger\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003eRec.\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/chapter/10.1007/978-3-030-86337-1_8#Sec6\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n  \u003ctr\u003e\n    \u003ctd colspan=\"2\"\u003e2021/ICDAR\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://github.com/biswassanket/synth_doc_generation\" target=\"_blank\" rel=\"noopener noreferrer\"\u003eDocSynth\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003ca href=\"https://link.springer.com/chapter/10.1007/978-3-030-86334-0_36\" target=\"_blank\" rel=\"noopener noreferrer\"\u003ePDF\u003c/a\u003e\u003c/td\u003e\n    \u003ctd\u003e\u003c/td\u003e\n  \u003c/tr\u003e\n\u003c/tbody\u003e\n\u003c/table\u003e\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fxinke-wang%2Focrdatasets","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fxinke-wang%2Focrdatasets","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fxinke-wang%2Focrdatasets/lists"}