https://github.com/pprp/captcha_identify.pytorch
基于torch进行验证码识别,识别率达94%
https://github.com/pprp/captcha_identify.pytorch
captcha cnn deep-learning pytorch
Last synced: 8 months ago
JSON representation
基于torch进行验证码识别,识别率达94%
- Host: GitHub
- URL: https://github.com/pprp/captcha_identify.pytorch
- Owner: pprp
- License: mit
- Created: 2019-10-20T01:35:49.000Z (over 6 years ago)
- Default Branch: master
- Last Pushed: 2023-06-23T03:03:25.000Z (about 3 years ago)
- Last Synced: 2025-04-06T05:31:57.190Z (about 1 year ago)
- Topics: captcha, cnn, deep-learning, pytorch
- Language: Python
- Homepage:
- Size: 293 MB
- Stars: 116
- Watchers: 2
- Forks: 26
- Open Issues: 10
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 深度学习识别验证码
基于: https://github.com/dee1024/pytorch-captcha-recognition 进行修改
本项目致力于使用神经网络来识别各种验证码。
在这个库的基础上,进行了改动,添加了很多trick来增强识别效果,如attention机制,dual pooling, ibn模块,bnneck,center loss等。
链接为:https://github.com/pprp/captcha.Pytorch
改动
===
- 添加了更多torchvision中支持的模型
- 改了一下文件的名称
- 支持了GPU,当然cpu也可以
- 添加了以下功能:训练完成一个epoch之后进行测试,(需要保证test和train中的模型一致)
- 添加了以下功能:将每次得到的测试结果写入results.txt文件,运行torch_util.py得到results.png可视化准确率。
- RES152为基础网络进行训练,混合数字和大写字符只能达到94%,还达不到原作者的识别率,希望得到赐教
特性
===
- __端到端,不需要做更多的图片预处理(比如图片字符切割、图片尺寸归一化、图片字符标记、字符图片特征提取)__
- __验证码包括数字、大写字母、小写__
- __采用自己生成的验证码来作为神经网络的训练集合、测试集合、预测集合__
- __纯四位数字,验证码识别率高达 99.9999 %__
- __四位数字 + 大写字符,验证码识别率约 96 %__
- __深度学习框架pytorch + 验证码生成器ImageCaptcha__
原理
===
- __训练集合生成__
使用常用的 Python 验证码生成库 ImageCaptcha,生成 10w 个验证码,并且都自动标记好;
如果需要识别其他的验证码也同样的道理,寻找对应的验证码生成算法自动生成已经标记好的训练集合或者手动对标记,需要上万级别的数量,纯手工需要一定的时间,再或者可以借助一些网络的打码平台进行标记
- __训练卷积神经网络__
构建一个多层的卷积网络,进行多标签分类模型的训练
标记的每个字符都做 one-hot 编码
批量输入图片集合和标记数据,大概15个Epoch后,准确率已经达到 96% 以上
验证码识别率展示
========

快速开始
====
- __步骤一:10分钟环境安装__
Python3.6+ 、ImageCaptcha库(pip install captcha)、 Pytorch(参考官网http://pytorch.org)
- __步骤二:生成验证码__
```bash
python captchaGenerator.py
```
执行以上命令,会在目录 dataset/train/ 下生成多张验证码图片,图片已经标注好,数量可以是 1w、5w、10w,通过 captchaGenerator.py 内的 count 参数设定
- __步骤三:训练模型__
```bash
python train.py
```
使用步骤一生成的验证码图集合用CNN模型(在 models 中定义)进行训练,训练完成会生成文件保存在weights文件夹中,最好的结果保存为`cnn_best.pt`
- __步骤四:测试模型__
```bash
python test.py
```
可以在控制台,看到模型的准确率(如 95%) ,如果准确率较低,回到步骤一,生成更多的图片集合再次训练
- __步骤五:使用模型做预测__
```bash
python predict.py
```
可以在控制台,看到预测输出的结果
可视化
===

贡献
===
我们期待你的 pull requests !
有问题欢迎提出issue
作者
===
* __Dee Qiu__
* 补充:__pprp__ <1115957667@qq.com>
声明
===
本项目仅用于交流学习