https://github.com/transcentlin/api-probe-platform
先进的大模型 API 多服务商性能与兼容性评估平台 | An advanced, multi-provider LLM API performance benchmark and evaluation platform.
https://github.com/transcentlin/api-probe-platform
api-benchmark api-evaluation deepseek fastapi llm-benchmark llm-evaluation llm-testing model-evaluation ollama openai-compatibility python react-dashboard tool-calling
Last synced: about 6 hours ago
JSON representation
先进的大模型 API 多服务商性能与兼容性评估平台 | An advanced, multi-provider LLM API performance benchmark and evaluation platform.
- Host: GitHub
- URL: https://github.com/transcentlin/api-probe-platform
- Owner: transcentlin
- License: mit
- Created: 2026-06-16T14:04:05.000Z (1 day ago)
- Default Branch: main
- Last Pushed: 2026-06-16T14:52:40.000Z (1 day ago)
- Last Synced: 2026-06-16T16:24:41.631Z (1 day ago)
- Topics: api-benchmark, api-evaluation, deepseek, fastapi, llm-benchmark, llm-evaluation, llm-testing, model-evaluation, ollama, openai-compatibility, python, react-dashboard, tool-calling
- Language: Python
- Size: 296 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# API 平台测试系统 (API Probe Platform)
[](https://github.com/transcentlin/API-Probe-Platform/stargazers)
[](https://github.com/transcentlin/API-Probe-Platform/releases)
[](LICENSE)
[](https://www.python.org/)
[](https://react.dev/)
[](https://fastapi.tiangolo.com/)
> **先进的大模型 API 多服务商性能与兼容性评估平台** | An advanced, multi-provider LLM API performance benchmark and evaluation platform.
一个面向 LLM API 服务商的全方位性能、能力及兼容性评估与测试平台。系统提供了统一的 CLI 命令行入口以及直观的 Web 可视化仪表盘,旨在全方位评估并对比各大主流大模型(LLM)API 提供商在核心能力维度上的表现。
---
## 🌟 核心功能
- **多维度能力评估探针 (Probes)**:针对 LLM 核心能力进行深度测评:
- **Reasoning**:推理与长链思考能力
- **Tool Calling**:工具/函数调用准确率与参数解析
- **JSON Mode**:输出结构化 JSON 数据的遵从度
- **Streaming**:流式传输的响应首包延迟与稳定性
- **Vision**:多模态/视觉理解评估
- **Basic Chat & Web Search**:基础对话响应延迟及联网搜索评估
- **无泄漏的零配置安全管理**:采用高强度的本地配置文件加密机制(如 `platforms.enc`),配合系统环境变量注入,从源头上彻底规避 API 密钥和敏感凭证在 Git 提交历史中泄露的风险。
- **统一的双入口操作**:支持便捷的一键 CLI 自动化评估运行,并提供基于 React + Vite 的精美 Web 监控控制台,实时查看测试进度与对比结果。
- **详尽的报告生成与解析**:自动将测试原始日志解析为结构化的评分卡与可视化对比报告。
---
## 🛠️ 技术栈
| 层级 | 技术 |
|---|---|
| **后端/核心引擎** | Python 3.x · FastAPI · HTTPX · PyYAML · Cryptography |
| **前端控制台** | React (Vite) · Vanilla CSS · 现代深色主题 · 微交互动效 |
| **存储** | 轻量级本地文件数据库 · 结构化 JSON 存储 |
---
## 🚀 快速开始
### 准备条件
- Python 3.8+
- Node.js 18+ (用于 Web 前端运行)
### 安装步骤
1. **克隆项目仓库**:
```bash
git clone https://github.com/transcentlin/API-Probe-Platform.git
cd API-Probe-Platform
```
2. **配置后端环境**:
```bash
pip install -r api_probe_system/requirements.txt
```
3. **配置前端环境**:
```bash
cd api_probe_system/frontend
npm install
```
### 启动运行
本系统支持 CLI 和 Web 双重入口:
#### 1. 启动 Web 可视化平台(推荐)
启动 FastAPI 后端服务:
```bash
python run_web.py
```
启动 React 前端服务:
```bash
cd api_probe_system/frontend
npm run dev
```
#### 2. CLI 命令行评估模式
您也可以直接在终端针对特定模型或能力运行单个探针:
```bash
python api_probe_system/run.py --help
```
---
## 🔒 凭证配置与安全规范
为了保护您的 API 密钥安全,系统在初始化配置时遵循以下规范:
1. 本地生成纯净的 `platforms.enc` 加密配置载体。
2. 通过环境变量注入各平台的 API Token。
3. 相关的解密 Key 必须置于代码库之外,禁止以任何形式上传至 Git。
---
## 🤝 贡献与反馈
欢迎提出 [Issue](https://github.com/transcentlin/API-Probe-Platform/issues) 或 [Pull Request](https://github.com/transcentlin/API-Probe-Platform/pulls),共同改进本项目。
如果您觉得本项目对您有帮助,请给我们一个 ⭐ Star,这是对开源开发者最大的鼓励!
---
## 📄 许可证
本项目基于 [MIT License](LICENSE) 开源。