https://github.com/librauee/dcic-ocr
2022 DCIC OCR赛题
https://github.com/librauee/dcic-ocr
Last synced: 8 months ago
JSON representation
2022 DCIC OCR赛题
- Host: GitHub
- URL: https://github.com/librauee/dcic-ocr
- Owner: librauee
- Created: 2022-04-26T23:55:25.000Z (about 4 years ago)
- Default Branch: main
- Last Pushed: 2022-04-27T09:19:22.000Z (about 4 years ago)
- Last Synced: 2025-04-17T22:09:07.072Z (about 1 year ago)
- Language: Python
- Homepage: https://www.dcic-china.com/competitions/10023
- Size: 111 KB
- Stars: 5
- Watchers: 1
- Forks: 2
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 基于文本字符的交易验证码识别
* A榜第3、B榜第6
* part2_code是队友@[Ernnnn](https://github.com/Ernnnn/)的
## 解决方案
* 使用基于多分类的思路,以effb4为主要模型
* 使用多种数据增强手段进行增强,包括mixup、cutmix、fmix等
* 使用imagecaptcha库进行数据生成
* 使用EMA增强模型性能
* 使用贝叶斯优化提升模型融合效果
## 运行步骤
1. 下载image文件夹内的镜像并用7z解压
2. 将训练、测试数据分别放置于raw_data/train,raw_data/test
3. 运行image/run.sh脚本即可得到结果