An open API service indexing awesome lists of open source software.

https://github.com/lexmount/gpu-dispatcher-api

SageProxy Backend 是一个基于 FastAPI 构建的中间层服务。它的核心职责是安全地代理外部用户的计算请求,并将其转化为 AWS SageMaker Training Jobs,从而实现 GPU 资源的按需调度与自动释放。
https://github.com/lexmount/gpu-dispatcher-api

Last synced: 2 months ago
JSON representation

SageProxy Backend 是一个基于 FastAPI 构建的中间层服务。它的核心职责是安全地代理外部用户的计算请求,并将其转化为 AWS SageMaker Training Jobs,从而实现 GPU 资源的按需调度与自动释放。

Awesome Lists containing this project

README

          

# GPU Instance Broker API

基于 FastAPI 的轻量 REST 服务:算法侧通过 `POST /api/v1/allocate-gpu` 申请 GPU EC2,接口返回公网 IP 与 SSH 私钥。无前端、无 SageMaker / S3 上传逻辑。

详细约定与联调说明见仓库根目录 [develop.md](develop.md)。

## 依赖与启动

```bash
uv venv .venv && source .venv/bin/activate
uv sync
cp .env.example .env # 填入具有 EC2 权限的 AWS 凭证
uvicorn main:app --reload --host 0.0.0.0 --port 8000
```

交互文档:

## 调用方保存密钥

将响应中的 `private_key` 写入 `my_key.pem`,执行:

```bash
chmod 400 my_key.pem
ssh -i my_key.pem ubuntu@
```