Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/lilydjwg/luoxu
A Telegram userbot to index Chinese and Japanese group contents.
https://github.com/lilydjwg/luoxu
chinese telegram telegram-bot telegram-userbot
Last synced: about 2 months ago
JSON representation
A Telegram userbot to index Chinese and Japanese group contents.
- Host: GitHub
- URL: https://github.com/lilydjwg/luoxu
- Owner: lilydjwg
- License: gpl-3.0
- Created: 2021-04-26T08:18:34.000Z (over 3 years ago)
- Default Branch: master
- Last Pushed: 2024-07-30T05:19:04.000Z (about 2 months ago)
- Last Synced: 2024-07-30T08:48:17.949Z (about 2 months ago)
- Topics: chinese, telegram, telegram-bot, telegram-userbot
- Language: Python
- Homepage:
- Size: 145 KB
- Stars: 238
- Watchers: 3
- Forks: 24
- Open Issues: 2
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
功能说明
====落絮可以 CJK 友善的方式索引 Telegram 群组与频道,并提供 API 供前端使用。
风险提示
====本程序使用 userbot,有被封号的风险。请三思而后行!
安装与配置
====配置 luoxu
----* 安装 Rust nightly 以及 [OpenCC](https://github.com/BYVoid/OpenCC) 库。
```bash
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
rustup toolchain install nightly
```* Python 库依赖请见 `requirements.txt` 文件
* [获取](https://core.telegram.org/api/obtaining_api_id)一份 Telegram API key
* 在 `querytrans` 目录下运行 `rustup run nightly cargo build --release` 然后把生成的文件(`target/release/libquerytrans.so`)复制为 `querytrans.so` 并放在 Python 能找到的地方(比如当前目录)需要注意的是:构建 `querytrans` 之前需要提前准备好 python 环境,如果与运行 luoxu 的环境不一致将会出错。
* 复制 `config.toml.example` 并按需要修改
* (可选)词云插件需要在 `luoxu-cutwords` 下运行 `cargo build --release` 并将生成的可执行文件放到 `$PATH` 中使用 `python -m luoxu.ls_dialogs` 可以列出会话的 id 和名称。频道和群组的 id 可以用于配置文件中。
设置数据库
----* 安装 PostgreSQL 及 pgroonga
* 使用 `createdb` 命令创建数据库
* 使用 `postgres` 用户身份连接到该数据库,并执行 `CREATE EXTENSION pgroonga;`
* 导入 `dbsetup.sql` 脚本,如 `psql DBNAME < dbsetup.sql`运行
----在本项目目录下(或者将本项目目录加入 Python 模块路径),执行:
```sh
python -m luoxu
```配置 Web 前端
----* 可使用 [luoxu-web](https://github.com/lilydjwg/luoxu-web)
* 修改 `src/App.svelte` 中的 API URL
* 运行 `npm run build` 编译文件
* 使用 Web 服务器 serve `dist` 目录你也可以使用 Vercel 来方便快捷地部署此项目。
当然了,你也可以自己另外编写 Web 页面来使用此 API。
注意事项
====不要直接将索引了私有群组/频道的 API 公开于网络上!任何人都能获取其内容的。公开索引了公开群组或频道的服务前,也请获取群组/频道管理员的同意。
luoxu 相当于运行一个 Telegram 客户端,其权限是完全的(包括创建新的登录、结束已有会话、设置两步验证等)。请注意保护账号安全,不要在不信任的服务器上登录与运行本项目!
请注意配置数据库权限。Arch Linux 上默认安装的 PostgreSQL 很可能是对本地用户不设防的(请查阅 `/var/lib/postgres/data/pg_hba.conf` 配置文件)。
使用
====搜索消息时,搜索字符串不区分简繁(会使用 OpenCC 自动转换),也不进行分词(请手动将可能不连在一起的词语以空格分开)。
搜索字符串支持以下功能:
* 以空格分开的多个搜索词是「与」的关系
* 使用 `OR`(全大写)来表达「或」条件
* 使用 `-` 来表达排除,如 `落絮 - 测试`
* 使用小括号来分组数据库升级
====当对 PostgreSQL 进行跨版本升级时,需要额外处理 pgroonga 的事情。
步骤示意:
1. 安装新的数据库软件
2. `cp /usr/lib/postgresql/pgroonga* /opt/pgsql-13/lib`
3. 安装新的 pgroonga
4. 执行升级(`pg_upgrade`)
5. 如果 pgroonga 版本已更新,执行 [pgroonga 升级流程](https://pgroonga.github.io/upgrade/)
5. 升级完成之后需要重新索引(如果索引已被连带删除,从 SQL 文件中找到创建索引的语句并执行):```sql
reindex index usernames_idx;
reindex index message_idx;
```不兼容的变更
====* [2022年06月23日](update-2022-06-23.md),采用分区表来提升部分查询的性能。需要更新配置文件及数据库。