https://github.com/xumingke-06/docagent
Local-first AI document agent — generate, read, modify, and convert Word/Excel/PPT/PDF/Markdown through natural language conversations. Built with Tauri 2 + Rust + React.
https://github.com/xumingke-06/docagent
ai-agent desktop-app document-processing excel llm markdown pdf powerpoint react rust tauri tool-calling word
Last synced: 17 days ago
JSON representation
Local-first AI document agent — generate, read, modify, and convert Word/Excel/PPT/PDF/Markdown through natural language conversations. Built with Tauri 2 + Rust + React.
- Host: GitHub
- URL: https://github.com/xumingke-06/docagent
- Owner: XuMingKe-06
- Created: 2026-05-16T15:33:57.000Z (about 1 month ago)
- Default Branch: main
- Last Pushed: 2026-06-04T11:55:51.000Z (17 days ago)
- Last Synced: 2026-06-04T12:15:37.628Z (17 days ago)
- Topics: ai-agent, desktop-app, document-processing, excel, llm, markdown, pdf, powerpoint, react, rust, tauri, tool-calling, word
- Language: Rust
- Homepage:
- Size: 1.53 MB
- Stars: 1
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# DocAgent
**AI 驱动的文档处理 Agent,用对话搞定一切文档工作**
[](https://github.com/user-attachments/docagent)
[](https://v2.tauri.app/)
[](https://react.dev/)
[](https://www.rust-lang.org/)
[](./LICENSE)
[中文](./README.md) | [English](./README_en.md)
---
## DocAgent 是什么?
DocAgent 是一款**本地优先**的 AI 文档处理桌面应用。你只需用自然语言描述需求,AI Agent 就会自动完成文档的生成、读取、修改、格式转换等操作。
不再在 Word、Excel、PPT、PDF 之间来回切换工具 -- 一个对话窗口,覆盖所有文档格式。
---
## 为什么选择 DocAgent?
### 本地优先,数据安全
所有文档处理和文件操作都在你的机器上完成,只有 LLM API 调用需要联网。你的文档内容不会上传到任何第三方服务器。
### 多 LLM Provider 支持
灵活接入 OpenAI、Anthropic Claude、Google Gemini、Ollama 等主流 LLM 服务,自动健康检查与故障切换,你不会被单一供应商锁定。
### 专业文档处理引擎
内置 6 大文档处理技能,覆盖从生成到分析的完整工作流:
| 技能 | 说明 |
|------|------|
| **generate_document** | 生成 Word / Excel / PPT / PDF / Markdown,支持公式、条件格式、颜色方案、水印等高级特性 |
| **read_document** | 读取文档结构与内容,支持格式信息提取 |
| **modify_document** | 30+ 修改操作:段落、表格、书签、超链接、页眉页脚、目录等 |
| **convert_format** | docx / pdf / md / txt / csv / html 等格式互转 |
| **analyze_document** | 文档结构分析与统计信息 |
| **batch_process** | 批量转换、修改、分析 |
### 安全可控的操作确认
高风险操作(删除、修改、批量处理)需用户确认后才执行,支持三级确认策略:始终确认 / 仅编辑确认 / 从不确认。
### 版本快照与回滚
每次文档修改自动创建版本快照,一键回滚到任意历史版本,再也不怕改错。
### 实时文件监听
工作区文件变更实时同步到界面,配合内置文件树浏览,文档状态一目了然。
---
## 技术亮点
- **Tauri 2.x** -- Rust 后端 + Web 前端,安装包小、启动快、内存占用低
- **Rust Agent 引擎** -- 异步 Tool Calling 循环,流式输出,增量持久化防崩溃丢失
- **Python Sidecar** -- 专业文档处理(python-docx / openpyxl / python-pptx / PyMuPDF / reportlab),进程级隔离,崩溃自动重启
- **多 LLM 路由** -- Provider 健康检查、延迟追踪、自动 Fallback
- **React 19 + Zustand 5** -- 现代前端架构,虚拟滚动优化长列表性能
- **PDF Canvas 渲染** -- 基于 pdfjs-dist 的高性能 PDF 预览,支持缩放与翻页
- **统一错误码体系** -- 按模块分段(LLM / Agent / Doc / DB / Config / FS / Runtime),精确定位问题
---
## 界面预览
### 主界面

### 文档生成效果

---
## 使用示例
**生成一份项目周报:**
> 帮我生成一份项目周报 Word 文档,包含本周完成事项、下周计划和风险提示三个部分
**读取并分析 Excel:**
> 读取 data/sales.xlsx,分析各区域的销售数据,生成一份统计摘要
**批量格式转换:**
> 把 workspace/docs 目录下所有 Markdown 文件转换为 PDF
**修改现有文档:**
> 在 report.docx 的第三段后面插入一个三行四列的表格,表头是"姓名、部门、职位、入职日期"
---
## 配置与自定义
### LLM Provider 配置
支持 OpenAI、Anthropic、Gemini、Ollama 及任何兼容 OpenAI API 的服务。在设置页添加你的 API Key 和模型即可开始使用。
### 技能管理
6 个内置文档处理技能可按需启用/禁用,在设置页的技能标签页管理。
### Prompt 模板
内置模板管理系统,保存常用 Prompt,一键复用。
### 快捷键
可自定义快捷键:新建会话、关闭会话、发送消息、切换侧栏、快速 Prompt 等。
---
## 贡献
欢迎贡献代码、报告问题或提出建议!
1. Fork 本仓库
2. 创建功能分支 (`git checkout -b feature/amazing-feature`)
3. 提交更改 (`git commit -m 'feat: 添加某个很棒的功能'`)
4. 推送分支 (`git push origin feature/amazing-feature`)
5. 创建 Pull Request
---
## 技术栈一览
| 类别 | 技术 |
|------|------|
| 桌面框架 | Tauri 2.x |
| 前端 | React 19 + TypeScript 5 + Vite 6 |
| UI | Shadcn/ui + Radix + Tailwind CSS 4 |
| 状态管理 | Zustand 5 |
| 后端 | Rust (Tokio 异步运行时) |
| 数据库 | SQLite (rusqlite, bundled) |
| 文档处理 | Python Sidecar (python-docx / openpyxl / python-pptx / PyMuPDF / reportlab) |
| PDF 预览 | pdfjs-dist |
| 图表 | Recharts |
| 自动更新 | tauri-plugin-updater |
---
## 许可证
本项目基于 [MIT 许可证](./LICENSE) 开源。