https://github.com/Samge0/ragflow-upload
自动批量上传并解析文档至 RagFlow 知识库,省去手动操作,提升效率。
https://github.com/Samge0/ragflow-upload
Last synced: about 1 month ago
JSON representation
自动批量上传并解析文档至 RagFlow 知识库,省去手动操作,提升效率。
- Host: GitHub
- URL: https://github.com/Samge0/ragflow-upload
- Owner: Samge0
- License: mit
- Created: 2024-08-26T08:58:04.000Z (8 months ago)
- Default Branch: main
- Last Pushed: 2025-02-08T15:12:42.000Z (3 months ago)
- Last Synced: 2025-02-08T16:21:44.212Z (3 months ago)
- Language: Python
- Size: 19.5 KB
- Stars: 70
- Watchers: 3
- Forks: 3
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
- awesome-hacking-lists - Samge0/ragflow-upload - 自动批量上传并解析文档至 RagFlow 知识库,省去手动操作,提升效率。 (Python)
README
## 上传文档到RagFlow知识库
[RagFlow](https://github.com/infiniflow/ragflow)是一个基于 LLM 的问答系统,能够快速构建智能问答平台。然而,RagFlow 默认的知识库上传界面存在一些局限性:每次只能上传有限数量的文件,并且上传后还需手动启动解析流程,当需要上传大量文件时,这样的操作便显得有些繁琐。为了简化这一过程,我编写了一个脚本,该脚本可以遍历指定目录,自动逐个将文档上传至 RagFlow 知识库,并立即启动解析。当一个文档解析完成后,脚本将自动上传并解析下一个文档。特别是在需要上传大量文件时,这显著减少了人工干预,避免了手动分批上传和解析的等待时间。
(例如,我自己需要将mac中所有备忘录内容导入到知识库中查询)
### 创建env环境
```shell
conda create -n ragflow-upload python=3.10.13 -y
```### 安装依赖
```shell
pip install -r requirements.txt
```## 复制并配置[ragflows/configs.py](ragflows/configs.py)
关于配置文件的说明可参考这个:[issues #2](https://github.com/Samge0/ragflow-upload/issues/2)
```shell
cp ragflows/configs.demo.py ragflows/configs.py
```### 上传文档
```shell
python ragflows/main.py
```### 相关截图

