{"id":41066818,"url":"https://github.com/th1nhhdk/local_ai_ocr","last_synced_at":"2026-04-25T10:03:49.595Z","repository":{"id":325527741,"uuid":"1101525896","full_name":"th1nhhdk/local_ai_ocr","owner":"th1nhhdk","description":"An local, offline (after initial setup), portable OCR software that can process images and PDF files, using DeepSeek-OCR AI (running directly on your machine).","archived":false,"fork":false,"pushed_at":"2026-02-21T10:15:31.000Z","size":13587,"stargazers_count":704,"open_issues_count":0,"forks_count":178,"subscribers_count":3,"default_branch":"master","last_synced_at":"2026-02-21T16:52:07.681Z","etag":null,"topics":["ai","deepseek-ocr","english","llm","local","multilanguage","multilingual","ocr","offline","portable","vietnamese","vllm"],"latest_commit_sha":null,"homepage":"","language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"apache-2.0","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/th1nhhdk.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null,"notice":null,"maintainers":null,"copyright":null,"agents":null,"dco":null,"cla":null}},"created_at":"2025-11-21T19:57:30.000Z","updated_at":"2026-02-21T10:14:06.000Z","dependencies_parsed_at":null,"dependency_job_id":null,"html_url":"https://github.com/th1nhhdk/local_ai_ocr","commit_stats":null,"previous_names":["th1nhhdk/local_ai_ocr"],"tags_count":8,"template":false,"template_full_name":null,"purl":"pkg:github/th1nhhdk/local_ai_ocr","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/th1nhhdk%2Flocal_ai_ocr","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/th1nhhdk%2Flocal_ai_ocr/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/th1nhhdk%2Flocal_ai_ocr/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/th1nhhdk%2Flocal_ai_ocr/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/th1nhhdk","download_url":"https://codeload.github.com/th1nhhdk/local_ai_ocr/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/th1nhhdk%2Flocal_ai_ocr/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":32257757,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-04-25T09:15:33.318Z","status":"ssl_error","status_checked_at":"2026-04-25T09:15:31.997Z","response_time":59,"last_error":"SSL_read: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["ai","deepseek-ocr","english","llm","local","multilanguage","multilingual","ocr","offline","portable","vietnamese","vllm"],"created_at":"2026-01-22T12:41:30.141Z","updated_at":"2026-04-25T10:03:49.586Z","avatar_url":"https://github.com/th1nhhdk.png","language":"Python","readme":"\u003cimg src='src/res/icon.png' width='128' height='128'\u003e\n\n### Ngôn ngữ:\nTiếng Việt |\n[English](README_en.md)\n\n# Local AI OCR (v2.3.1)\n\nMột phần mềm OCR **nội bộ**, **offline** (sau khi thiết lập lần đầu), **portable**, có thể xử lý ảnh và tệp PDF, sử dụng AI *DeepSeek-OCR* (chạy nội bộ trực tiếp trên máy).\n\n![screenshot_v2.2](assets/screenshot_v2.2.png)\n\n## Tính năng\n\n- **Chạy offline (nội bộ):** **Không cần kết nối mạng, cũng chả liên lạc đi đâu**, đảm bảo bảo mật dữ liệu tuyệt đối.\n- **Hỗ trợ GPU (và CPU):** Tự động phát hiện và sử dụng GPU để tăng tốc, nếu không thể sử dụng GPU thì tự động chuyển sang CPU (CPU sẽ chậm hơn nhiều).\n- **Hỗ trợ đa ngôn ngữ:** Tiếng Việt, Tiếng Anh, Tiếng Trung, Tiếng Nhật, ...\n- **Hỗ trợ nhiều định dạng tệp:** Ảnh `.png`, `.jpg`, `.webp`, `.heic`, `.heif` và Tài liệu `.pdf`.\n- **Xử lý PDF thông minh:** Cho phép chọn phạm vi trang để xử lý (với các tệp PDF \u003e=2 trang).\n- **Hệ thống Hàng chờ:** Cho phép xử lý lần lượt nhiều tệp.\n- **Kết quả đẹp:** Hỗ trợ hiển thị kết quả có định dạng thay vì văn bản thô, **cho phép giữ nguyên định dạng** để dán vào Word, ...\n- **Hình minh họa quá trình OCR:** Nhìn thấy AI đang đọc đến đoạn nào bằng cách nhìn hộp bao quanh. (khá ngầu).\n- **Có 3 chế độ xử lý:**\n  - **Tài liệu Markdown (giữ định dạng):** Trích xuất văn bản, cố gắng giữ bố cục (Table, ...)\n  - **OCR Tự do (Free OCR):** Trích xuất văn bản, giữ bố cục tốt hơn \"`OCR Tiêu chuẩn`\".\n  - **OCR Tiêu chuẩn:** Trích xuất văn bản, giữ bố cục không tốt.\n- **Giao diện tự động phát hiện Ngôn ngữ:** dựa vào việc máy có `Cốc Cốc` hoặc `Zalỏ` hay không.\n- **Tự động xả Model AI để giải phóng bộ nhớ:** Sau khi \"`Bắt đầu xử lý`\" lần đầu thì Model AI sẽ được nạp vào bộ nhớ, sau khi hoàn thành đợi 5 phút thì bộ nhớ sẽ tự được giải phóng (Hoặc nhấn nút \"`Xả Model AI` để giải phóng bộ nhớ ngay).\n\n## Yêu cầu hệ thống (khuyến nghị)\n\n- **Lưu ý:** Bạn vẫn có thể chạy phần mềm này mặc dù không đạt yêu cầu hệ thống (**thậm chí không GPU vẫn chạy được**), nhưng tốc độ sẽ chậm hơn nhiều.\n\n- **OS:** Windows 10 trở lên\n- **CPU:** Tối thiểu 4 lõi/8 luồng\n- **RAM:** Tối thiểu 16GB\n- **Dung lượng trống:** Khoảng 11GB\n- **GPU:** Có GPU (nên dùng Nvidia), với tối thiểu 8GB VRAM\n  - **Lưu ý:** Phần mềm sẽ cố dùng GPU, thậm chí khi dung lượng VRAM không đạt yêu cầu để tăng tốc phần mềm.\n\n## Tải về và thiết lập\n\n0. Tải file `.zip` trong mục Releases (bên phải, dưới About), giải nén nó ra\n1. Chạy `env_setup.cmd`\n   - **Lưu ý:** Script này sẽ tải về file (weights) AI nặng 6.67 GB\n\n- Bạn đã hoàn thành việc thiết lập phần mềm, phần mềm sẽ không cần kết nối mạng nữa.\n\n## Lưu ý trước khi sử dụng\n\n- Vì giới hạn kỹ thuật, AI OCR **có thể bị kẹt** trong vòng lặp vô hạn. Nếu chuyện đó xảy ra, hãy nhấn **DỪNG LẠI**.\n- Mặc dù `DeepSeek-OCR` có độ chính xác cực cao, bạn **vẫn nên kiểm tra lại kết quả**, đặc biệt với tài liệu quan trọng.\n- Lần chạy đầu tiên luôn tốn một chút thời gian để load AI Model vào bộ nhớ.\n- Việc kéo và thả các tệp tin có thể sẽ không giữ lại thứ tự tệp, đây là giới hạn phần mềm và hiện không có cách khắc phục.\n\n## Hướng dẫn sử dụng\n\n1. **Khởi động phần mềm:**\n   - Chạy file `run.cmd` để khởi động phần mềm (sử dụng GPU nếu có thể).\n   - Nếu bạn muốn ép phần mềm chạy bằng CPU, hãy dùng `run_cpu-only.cmd`.\n\n2. **Sử dụng phần mềm:**\n   - **2a. Quản lý tệp tin:**\n      + Thêm ảnh/Thêm PDF: Chọn trang tài liệu cần xử lý để thêm vào `Hàng chờ xử lý`.\n      + Xóa Hàng chờ: Xóa sạch danh sách `Hàng chờ xử lý`.\n   - **2b. Chọn chế độ (nên giữ mặc định):** Chọn giữa 3 chế độ OCR, mặc định là tốt nhất.\n      - **Lưu ý:** Nếu chế độ mặc định không in ra gì cả (hình bạn đưa quá phức tạp), thì hãy thử chế độ \"`OCR Tự do (Free OCR)`\".\n   - *Mẹo:* Nếu bạn không muốn những dòng như `--- Đang xử lý: demo1.png ---` xuất hiện trong `Kết quả` thì hãy tắt \"`In Trạng thái xử lý trong Kết quả:`\".\n   - **2c. Bắt đầu OCR:** Nhấn nút \"`Bắt đầu xử lý`\" để bắt đầu OCR.\n   - **2d. Kết quả:** Văn bản sau khi được xử lý sẽ hiển thị nội dung ở khung bên phải, bạn nên nhìn bên \"`Kết quả đẹp`\" (phần mềm sẽ tự chuyển qua Thẻ đó khi OCR kết thúc).\n   - **2e. Sao chép kết quả:** Nhấn nút này để sao chép nội dung trong ô \"`Kết quả`\", Nếu bạn đang ở Thẻ \"`Kết quả đẹp`\" thì định dạng sẽ được giữ nguyên, bạn có thể dán vào Word hoặc phần mềm khác.\n\n- *Mẹo*: Nhấn nút \"`Xả Model AI`\" giúp giải phóng RAM/VRAM khi bạn không có ý định tiếp tục sử dụng OCR, nhưng lại chưa muốn tắt phần mềm.\n\n## Xử lý vấn đề\n\n- Phần mềm dùng CPU và RAM, nhưng lại không đụng vào GPU Nvidia:\n   + Bạn bật `Nvidia Control Panel` lên xem Driver đang dùng là bản bao nhiêu? Phải bản `531` hoặc mới hơn mới sử dụng được.\n   + Bạn qua [Website của Nvidia](https://www.nvidia.com/en-us/geforce/drivers/) để tải Driver mới hơn nha.\n\n- `env_setup.bat` lỗi ở bước `[1/6]`:\n   + Bạn đang dùng Windows 10/11 21H2 à? thử năng cấp lên ít nhất 22H2 xem?\n\n- Nếu bạn gặp lỗi liên quan đến GPU, hãy dùng `run_wlog.cmd` để xem log lỗi, hoặc dùng `run_cpu-only.cmd` để phần mềm không sử dụng GPU.\n- Chế độ \"`Tài liệu Markdown (giữ định dạng)`\" không in ra gì cả: Hãy thử chế độ \"`OCR Tự do (Free OCR)`\".","funding_links":[],"categories":[],"sub_categories":[],"project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fth1nhhdk%2Flocal_ai_ocr","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fth1nhhdk%2Flocal_ai_ocr","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fth1nhhdk%2Flocal_ai_ocr/lists"}