https://github.com/lexmount/gpu-dispatcher-api
SageProxy Backend 是一个基于 FastAPI 构建的中间层服务。它的核心职责是安全地代理外部用户的计算请求,并将其转化为 AWS SageMaker Training Jobs,从而实现 GPU 资源的按需调度与自动释放。
https://github.com/lexmount/gpu-dispatcher-api
Last synced: 2 months ago
JSON representation
SageProxy Backend 是一个基于 FastAPI 构建的中间层服务。它的核心职责是安全地代理外部用户的计算请求,并将其转化为 AWS SageMaker Training Jobs,从而实现 GPU 资源的按需调度与自动释放。
- Host: GitHub
- URL: https://github.com/lexmount/gpu-dispatcher-api
- Owner: lexmount
- License: apache-2.0
- Created: 2026-03-25T12:43:15.000Z (3 months ago)
- Default Branch: main
- Last Pushed: 2026-04-07T19:26:51.000Z (3 months ago)
- Last Synced: 2026-04-13T07:38:53.015Z (2 months ago)
- Language: Python
- Size: 124 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# GPU Instance Broker API
基于 FastAPI 的轻量 REST 服务:算法侧通过 `POST /api/v1/allocate-gpu` 申请 GPU EC2,接口返回公网 IP 与 SSH 私钥。无前端、无 SageMaker / S3 上传逻辑。
详细约定与联调说明见仓库根目录 [develop.md](develop.md)。
## 依赖与启动
```bash
uv venv .venv && source .venv/bin/activate
uv sync
cp .env.example .env # 填入具有 EC2 权限的 AWS 凭证
uvicorn main:app --reload --host 0.0.0.0 --port 8000
```
交互文档:
## 调用方保存密钥
将响应中的 `private_key` 写入 `my_key.pem`,执行:
```bash
chmod 400 my_key.pem
ssh -i my_key.pem ubuntu@
```