{"id":13603160,"url":"https://github.com/dmMaze/BallonsTranslator","last_synced_at":"2025-04-11T13:33:04.135Z","repository":{"id":38084774,"uuid":"479735289","full_name":"dmMaze/BallonsTranslator","owner":"dmMaze","description":"深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑 | Yet another computer-aided comic/manga translation tool powered by deeplearning","archived":false,"fork":false,"pushed_at":"2025-04-07T18:27:02.000Z","size":59796,"stargazers_count":3512,"open_issues_count":197,"forks_count":229,"subscribers_count":20,"default_branch":"dev","last_synced_at":"2025-04-10T16:48:13.760Z","etag":null,"topics":["auto-translation","chinese-translation","comics","computer-aided-translation","computer-vision","deep-learning","inpainting","manga","ocr","pyqt","pyqt6","pytorch","qt","qt6","scene-text-detection"],"latest_commit_sha":null,"homepage":"","language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"gpl-3.0","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/dmMaze.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null}},"created_at":"2022-04-09T13:31:52.000Z","updated_at":"2025-04-10T14:01:57.000Z","dependencies_parsed_at":"2024-03-03T06:27:07.209Z","dependency_job_id":"cbc45cd0-0152-4e69-82fb-f2ee12f59683","html_url":"https://github.com/dmMaze/BallonsTranslator","commit_stats":{"total_commits":827,"total_committers":21,"mean_commits":39.38095238095238,"dds":"0.21886336154776298","last_synced_commit":"350f2a7d5b23693fa638f593b30bda838099ec64"},"previous_names":[],"tags_count":21,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/dmMaze%2FBallonsTranslator","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/dmMaze%2FBallonsTranslator/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/dmMaze%2FBallonsTranslator/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/dmMaze%2FBallonsTranslator/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/dmMaze","download_url":"https://codeload.github.com/dmMaze/BallonsTranslator/tar.gz/refs/heads/dev","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":248409841,"owners_count":21098771,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["auto-translation","chinese-translation","comics","computer-aided-translation","computer-vision","deep-learning","inpainting","manga","ocr","pyqt","pyqt6","pytorch","qt","qt6","scene-text-detection"],"created_at":"2024-08-01T18:01:54.697Z","updated_at":"2025-04-11T13:33:04.126Z","avatar_url":"https://github.com/dmMaze.png","language":"Python","funding_links":["https://ko-fi.com/voilelabs","https://www.patreon.com/voilelabs","https://www.patreon.com/mingshiba"],"categories":["Python"],"sub_categories":[],"readme":"\u003e [!IMPORTANT]  \n\u003e **如打算公开分享本工具的机翻结果，且没有有经验的译者进行过完整的翻译或校对，请在显眼位置注明机翻。**\n\n# BallonTranslator\n简体中文 | [English](/README_EN.md) | [pt-BR](doc/README_PT-BR.md) | [Русский](doc/README_RU.md) | [日本語](doc/README_JA.md) | [Indonesia](doc/README_ID.md) | [Tiếng Việt](doc/README_VI.md) | [한국어](doc/README_KO.md) | [Español](doc/README_ES.md)\n\n深度学习辅助漫画翻译工具，支持一键机翻和简单的图像/文本编辑  \n\n\u003cimg src=\"doc/src/ui0.jpg\" div align=center\u003e\n\n\u003cp align=center\u003e\n界面预览\n\u003c/p\u003e\n\n# Features\n* 一键机翻  \n  - 译文回填参考对原文排版的估计，包括颜色，轮廓，角度，朝向，对齐方式等\n  - 最后效果取决于文本检测，识别，抹字，机翻四个模块的整体表现  \n  - 支持日漫和美漫\n  - 英译中，日译英排版已优化，文本布局以提取到的背景泡为参考，中文基于 pkuseg 进行断句，日译中竖排待改善\n  \n* 图像编辑  \n  支持掩膜编辑和修复画笔\n  \n* 文本编辑  \n  - 支持所见即所得地富文本编辑和一些基础排版格式调整、[字体样式预设](https://github.com/dmMaze/BallonsTranslator/pull/311)\n  - 支持全文/原文/译文查找替换\n  - 支持导入导出 word 文档\n\n* 适用于条漫\n\n# 使用说明\n\n## Windows\n如果用 Windows 而且不想自己手动配置环境，而且能正常访问互联网:  \n从 [MEGA](https://mega.nz/folder/gmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https://drive.google.com/drive/folders/1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing) 下载 BallonsTranslator_dev_src_with_gitpython.7z，解压并运行 launch_win.bat 启动程序。如果无法自动下载库和模型，手动下载 data 和 ballontrans_pylibs_win.7z 并解压到程序目录下。  \n运行 scripts/local_gitpull.bat 获取更新。 \n注意这些打包版无法在 Windows 7 上运行，win 7 用户需要自行安装 [Python 3.8](https://www.python.org/downloads/release/python-3810/) 运行源码。\n\n## 运行源码\n\n安装 [Python](https://www.python.org/downloads/release/python-31011) **\u003c 3.12** (别用微软应用商店版) 和 [Git](https://git-scm.com/downloads)\n\n```bash\n# 克隆仓库\n$ git clone https://github.com/dmMaze/BallonsTranslator.git ; cd BallonsTranslator\n\n# 启动程序\n$ python3 launch.py\n\n# 更新程序\npython3 launch.py --update\n```\n\n第一次运行会自动安装 torch 等依赖项并下载所需模型和文件，如果模型下载失败，需要手动从 [MEGA](https://mega.nz/folder/gmhmACoD#dkVlZ2nphOkU5-2ACb5dKw) 或 [Google Drive](https://drive.google.com/drive/folders/1uElIYRLNakJj-YS0Kd3r3HE-wzeEvrWd?usp=sharing) 下载 data 文件夹(或者报错里提到缺失的文件)，并保存到源码目录下的对应位置。\n\n## 构建 macOS 应用（适用 apple silicon 芯片）\n[参考](doc/macOS_app_CN.md)  \n可能会有各种问题，目前还是推荐跑源码\n\n## 一键翻译\n**建议在命令行终端下运行程序**，首次运行请先配置好源语言/目标语言，打开一个带图片的文件夹，点击 Run 等待翻译完成  \n\u003cimg src=\"doc/src/run.gif\"\u003e  \n\n一键机翻嵌字格式如大小、颜色等默认是由程序决定的，可以在设置面板-\u003e嵌字菜单中改用全局设置。全局字体格式就是未编辑任何文本块时右侧字体面板显示的格式:  \n\u003cimg src=\"doc/src/global_font_format.png\"\u003e \n\n## 画板\n\n## 修复画笔\n\u003cimg src=\"doc/src/imgedit_inpaint.gif\"\u003e\n\u003cp align = \"center\"\u003e\n修复画笔\n\u003c/p\u003e\n\n### 矩形工具\n\u003cimg src=\"doc/src/rect_tool.gif\"\u003e\n\u003cp align = \"center\"\u003e\n矩形工具\n\u003c/p\u003e\n\n按下鼠标左键拖动矩形框抹除框内文字，按下右键拉框清除框内修复结果。  \n抹除结果取决于算法(gif 中的\"方法1\"和\"方法2\")对文字区域估算的准确程度，一般拉的框最好稍大于需要抹除的文本块。两种方法都比较玄学，能够应付绝大多数简单文字简单背景，部分复杂背景简单文字/简单背景复杂文字，少数复杂背景复杂文字，可以多拉几次试试。  \n勾选\"自动\"拉完框立即修复，否则需要按下\"修复\"或者空格键才进行修复，或 ```Ctrl+D``` 删除矩形选框。 \n\n## 文本编辑\n\u003cimg src=\"doc/src/textedit.gif\"\u003e\n\n\n\u003cp align = \"center\"\u003e\n文本编辑\n\u003c/p\u003e\n\n\u003cimg src=\"doc/src/multisel_autolayout.gif\" div align=center\u003e\n\u003cp align=center\u003e\n批量文本格式调整及自动排版\n\u003c/p\u003e\n\n\u003cimg src=\"doc/src/ocrselected.gif\" div align=center\u003e\n\u003cp align=center\u003e\nOCR并翻译选中文本框\n\u003c/p\u003e\n\n## 界面说明及快捷键\n* Ctrl+Z，Ctrl+Y 可以撤销重做大部分操作，注意翻页后撤消重做栈会清空\n* A/D 或 pageUp/Down 翻页，如果当前页面未保存会自动保存\n* T 切换到文本编辑模式下(底部最右\"T\"图标)，W激活文本块创建模式后在画布右键拉文本框\n* P 切换到画板模式，右下角滑条改原图透明度\n* 标题栏-\u003e运行 可以启用/禁用任意自动化模块，全部禁用后Run会根据全局字体样式和嵌字设置重新渲染文本  \n* 设置面板配置各自动化模块参数\n* Ctrl++/- 或滚轮缩放画布\n* Ctrl+A 可选中界面中所有文本块\n* Ctrl+F 查找当前页，Ctrl+G全局查找\n* 0-9调整嵌字/原图透明度\n* 文本编辑下 ```Ctrl+B``` 加粗，```Ctrl+U``` 下划线，```Ctrl+I``` 斜体\n* 字体样式面板-\"特效\"修改透明度添加阴影\n* ```Alt+Arrow Keys``` 或 ```Alt+WASD``` (正在编辑文本块时 ```pageDown``` 或 ```pageUp```) 在文本块间切换\n\n\u003cimg src=\"doc/src/configpanel.png\"\u003e  \n\n## 命令行模式 (无GUI)\n``` python\npython launch.py --headless --exec_dirs \"[DIR_1],[DIR_2]...\"\n```\n所有设置 (如检测模型, 原语言目标语言等) 会从 config/config.json 导入。  \n如果渲染字体大小不对, 通过 ```--ldpi ``` 指定 Logical DPI 大小, 通常为 96 和 72。\n\n# 自动化模块\n本项目重度依赖 [manga-image-translator](https://github.com/zyddnys/manga-image-translator)，在线服务器和模型训练需要费用，有条件请考虑支持一下\n- Ko-fi: \u003chttps://ko-fi.com/voilelabs\u003e\n- Patreon: \u003chttps://www.patreon.com/voilelabs\u003e\n- 爱发电: \u003chttps://afdian.net/@voilelabs\u003e\n\nSugoi 翻译器作者: [mingshiba](https://www.patreon.com/mingshiba)\n  \n### 文本检测\n * 暂时仅支持日文(方块字都差不多)和英文检测，训练代码和说明见https://github.com/dmMaze/comic-text-detector\n * 支持使用 [星河云（团子漫画OCR）](https://cloud.stariver.org.cn/)的文本检测，需要填写用户名和密码，每次启动时会自动登录。\n   * 详细说明见 [团子OCR说明](doc/团子OCR说明.md)\n * `YSGDetector` 是由 [lhj5426](https://github.com/lhj5426) 训练的模型，能更好地过滤日漫/CG里的拟声词。需要手动从 [YSGYoloDetector](https://huggingface.co/dreMaz/YSGYoloDetector) 下载模型放到 data/models 目录下。\n\n\n### OCR\n * 所有 mit 模型来自 manga-image-translator，支持日英汉识别和颜色提取\n * [manga_ocr](https://github.com/kha-white/manga-ocr) 来自 [kha-white](https://github.com/kha-white)，支持日语识别，注意选用该模型程序不会提取颜色\n * 支持使用 [星河云（团子漫画OCR）](https://cloud.stariver.org.cn/)的OCR，需要填写用户名和密码，每次启动时会自动登录。\n   * 目前的实现方案是逐个textblock进行OCR，速度较慢，准确度没有明显提升，不推荐使用。如果有需要，请使用团子Detector。\n   * 推荐文本检测设置为团子Detector时，将OCR设为none_ocr，直接读取文本，节省时间和请求次数。\n   * 详细说明见 [团子OCR说明](doc/团子OCR说明.md)\n\n\n### 图像修复\n  * AOT 修复模型来自 manga-image-translator\n  * patchmatch 是非深度学习算法，也是PS修复画笔背后的算法，实现来自 [PyPatchMatch](https://github.com/vacancy/PyPatchMatch)，本程序用的是我的[修改版](https://github.com/dmMaze/PyPatchMatchInpaint)\n  * lama* 是微调过的[lama](https://github.com/advimman/lama)\n  \n\n### 翻译器\n\n * 谷歌翻译器已经关闭中国服务，大陆再用需要设置全局代理，并在设置面板把 url 换成*.com\n * 彩云，需要申请 [token](https://dashboard.caiyunapp.com/)\n * papago  \n * DeepL 和 Sugoi (及它的 CT2 Translation 转换)翻译器，感谢 [Snowad14](https://github.com/Snowad14)，如果要使用Sugoi翻译器(仅日译英)，下载[离线模型](https://drive.google.com/drive/folders/1KnDlfUM9zbnYFTo6iCbnBaBKabXfnVJm)，将 ```sugoi_translator``` 移入 BallonsTranslator/ballontranslator/data/models。 \n * 支持 [Sakura-13B-Galgame](https://github.com/SakuraLLM/Sakura-13B-Galgame)。如果在本地单卡上运行且显存不足，可以在设置面板里勾选 ```low vram mode``` (默认启用)。\n * DeepLX 请参考[Vercel](https://github.com/bropines/Deeplx-vercel) 或 [deeplx](https://github.com/OwO-Network/DeepLX)\n * 支持两个版本的 OpenAI 兼容翻译器，支持兼容 OpenAI API 的官方或第三方LLM提供商，需要在设置面板里配置。\n   * 无后缀版本token消耗更小，但分句稳定性稍差，长文本翻译可能有问题。\n   * exp后缀版本token消耗更大，但稳定性更好，且在Prompt中进行了“越狱”，适合长文本翻译。\n\n其它优秀的离线英文翻译模型请参考[这条讨论](https://github.com/dmMaze/BallonsTranslator/discussions/515)  \n如需添加新的翻译器请参考[加别的翻译器](doc/加别的翻译器.md)，本程序添加新翻译器只需要继承基类实现两个接口即可不需要理会代码其他部分，欢迎大佬提 pr\n\n## 杂\n* 电脑带 Nvidia 显卡或 Apple silicon 默认启用 GPU 加速\n* 感谢 [bropines](https://github.com/bropines) 提供俄语翻译\n* 第三方输入法可能会造成右侧编辑框显示 bug，见[#76](https://github.com/dmMaze/BallonsTranslator/issues/76)，暂时不打算修\n* 选中文本迷你菜单支持*聚合词典专业划词翻译*[沙拉查词](https://saladict.crimx.com): [安装说明](doc/saladict_chs.md)\n* 启用 AMD（ROCm6）显卡加速步骤\n   * 更新显卡驱动至最新版（建议 24.12.1 及以上）\n   * 下载并安装 [AMD HIP SDK 6.2](https://www.amd.com/en/developer/resources/rocm-hub/hip-sdk.html)\n   * 下载 [ZLUDA](https://github.com/lshqqytiger/ZLUDA/releases)（ROCm6版本）并解压到 zluda 文件夹内\n   * 复制 zluda 文件夹到系统盘下：比如c盘（C:\\zluda）\n   * 配置系统环境变量\n  \n      这里以 windows 10 系统为例：设置 - 系统属性 - 高级系统设置 - 环境变量 - 系统变量 - 找到 path 变量\n  \n      点击编辑 在最后添加 `C:\\zluda` 和 `%HIP_PATH_62%bin` 两项\n  \n   * 替换 CUDA 库的动态链接文件\n  \n      将 `C:\\zluda` 文件夹内的 `cublas64_11.dll` `cusparse64_11.dll` 和 `nvrtc64_112_0.dll` 复制出一份到桌面\n\n      按如下规则重命名复制出来的文件\n\n      `原文件名` → `新文件名`\n\n      `cublas.dll` → `cublas64_11.dll`\n\n      `cusparse.dll` → `cusparse64_11.dll`\n\n      `nvrtc.dll` → `nvrtc64_112_0.dll`\n    \n      将已经重命名的文件替换掉 `BallonsTranslator\\ballontrans_pylibs_win\\Lib\\site-packages\\torch\\lib\\` 目录中的同名文件\n\n    * 启动程序并设置 OCR 和文本检测 为 Cuda **（图像修复请继续使用 CPU）**\n    * 运行 OCR 并等待 ZLUDA 编译 PTX 文件 **（首次编译大概需要 5-10 分钟，取决于 CPU 性能）**\n    * **下次运行无需编译**\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2FdmMaze%2FBallonsTranslator","html_url":"https://awesome.ecosyste.ms/projects/github.com%2FdmMaze%2FBallonsTranslator","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2FdmMaze%2FBallonsTranslator/lists"}