{"id":13642927,"url":"https://github.com/skythinker616/gpt-assistant-android","last_synced_at":"2026-04-19T12:01:35.633Z","repository":{"id":194467419,"uuid":"690860892","full_name":"Skythinker616/gpt-assistant-android","owner":"Skythinker616","description":"【新增智能体模式】安卓端全场景GPT助手，可用音量键唤起并进行语音交流，支持联网、拍照、模板、附件解析、智能体模式等 | GPT assistant for Android, activated via volume keys for voice interaction, supporting features such as networking, taking photos, templates, parsing PDF and Office documents, and agent mode.","archived":false,"fork":false,"pushed_at":"2026-04-19T10:08:51.000Z","size":102764,"stargazers_count":873,"open_issues_count":23,"forks_count":123,"subscribers_count":10,"default_branch":"master","last_synced_at":"2026-04-19T11:27:01.598Z","etag":null,"topics":["accessibility","agent","android","assistant","chatgpt","free-gpt","gpt","gpt-4-vision","llm","markdown","vlm"],"latest_commit_sha":null,"homepage":"","language":"Java","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"gpl-3.0","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/Skythinker616.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null,"notice":null,"maintainers":null,"copyright":null,"agents":null,"dco":null,"cla":null}},"created_at":"2023-09-13T03:08:40.000Z","updated_at":"2026-04-19T10:16:26.000Z","dependencies_parsed_at":"2024-01-05T07:34:07.583Z","dependency_job_id":"903ce911-a388-4d68-be9d-fa04f05f513f","html_url":"https://github.com/Skythinker616/gpt-assistant-android","commit_stats":null,"previous_names":["skythinker616/gpt-assistant-android"],"tags_count":23,"template":false,"template_full_name":null,"purl":"pkg:github/Skythinker616/gpt-assistant-android","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Skythinker616%2Fgpt-assistant-android","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Skythinker616%2Fgpt-assistant-android/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Skythinker616%2Fgpt-assistant-android/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Skythinker616%2Fgpt-assistant-android/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/Skythinker616","download_url":"https://codeload.github.com/Skythinker616/gpt-assistant-android/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/Skythinker616%2Fgpt-assistant-android/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":32005831,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-04-18T20:23:30.271Z","status":"online","status_checked_at":"2026-04-19T02:00:07.110Z","response_time":55,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["accessibility","agent","android","assistant","chatgpt","free-gpt","gpt","gpt-4-vision","llm","markdown","vlm"],"created_at":"2024-08-02T01:01:38.177Z","updated_at":"2026-04-19T12:01:35.601Z","avatar_url":"https://github.com/Skythinker616.png","language":"Java","funding_links":[],"categories":["Chatbots"],"sub_categories":[],"readme":"\u003cp\u003e\n\t\u003cb\u003e简体中文 | \u003ca href=\"README_en.md\"\u003eEnglish\u003c/a\u003e\u003c/b\u003e\n\u003c/p\u003e\n\n\u003cdiv align=center\u003e\n\t\u003cimg src=\"readme_img/icon.jpg\" height=\"100px\"/\u003e\n\t\u003ch1\u003eGPT Assistant\u003c/h1\u003e\n\u003c/div\u003e\n\n\u003cdiv align=center\u003e\n\t\u003cfont size=3\u003e\n\t\t\u003cb\u003e安卓端全场景 GPT 助手\u003c/b\u003e\u003cbr\u003e\n\t\t\u003cb\u003e快捷唤起 · 语音对话 · 联网 · 文件 · 智能体\u003c/b\u003e\n\t\u003c/font\u003e\n\u003c/div\u003e\n\n\u003cbr\u003e\n\n\u003cdiv align=center\u003e\n\t\u003cp\u003e\n\t\t\u003ca href=\"https://gitee.com/skythinker/gpt-assistant-android\"\u003e\n\t\t\t\u003cimg src=\"https://gitee.com/skythinker/gpt-assistant-android/badge/star.svg\"/\u003e\n\t\t\t\u003cimg src=\"https://gitee.com/skythinker/gpt-assistant-android/badge/fork.svg\"/\u003e\n\t\t\u003c/a\u003e\n\t\t\u003ca href=\"https://github.com/Skythinker616/gpt-assistant-android\"\u003e\n\t\t\t\u003cimg src=\"https://img.shields.io/github/stars/skythinker616/gpt-assistant-android?logo=github\u0026style=flat\"/\u003e\n\t\t\t\u003cimg src=\"https://img.shields.io/github/forks/skythinker616/gpt-assistant-android?logo=github\u0026style=flat\"/\u003e\n\t\t\u003c/a\u003e\n\t\t\u003cimg src=\"https://img.shields.io/badge/License-GPL3.0-red\"/\u003e\n\t\u003c/p\u003e\n\u003c/div\u003e\n\n---\n\n## 介绍\n\n### 主要特性\n\n- **多场景文件处理**：\n\t- 通过拍照 / 相册 / 分享 / 打开 / 拖拽上传\n\t- 支持图片 / TXT / PDF / DOCX / PPTX / XLSX 文件\n- **支持联网**：按需抓取网页内容发送给GPT\n- **全局快捷入口**：音量键唤醒 / 状态栏快捷键 / 跨应用划词调起\n- **智能模板**：轻松为每个模板自由定制界面（自定义下拉选框和输入框）\n- **多接口语音输入输出**：华为 / 百度 / Whisper / Google / 系统TTS\n- **智能体模式（实验性）**：允许AI自主操控手机（无需图像识别，支持任意模型） \n- **完全开源**：通过OpenAI API（或其兼容接口）提供服务，不收取任何费用\n\n---\n\n## 功能展示\n\n**一、基础使用：仅用音量键就可以操控**\n\n1. 长按音量下键唤出界面\n\n2. 按住音量键不放，开始语音输入\n\n3. 松开后再次短按，发送问题\n\n4. 接收回复的同时可以自动通过语音进行播报\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/usage.gif\" height=\"400px\"\u003e\n\u003c/div\u003e\n\n**二、用状态栏快捷键也可触发**\n\n下拉状态栏，点击“GPT”按钮，即可唤出界面，键盘会自动弹出，可以手动输入问题\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/tile_btn.gif\" height=\"400px\"\u003e\n\u003c/div\u003e\n\n**三、支持连续对话**\n\n激活界面上方的对话图标，即可进行连续对话，点击左侧的头像图标可以对单条对话进行删除、重试等操作\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/multi_chat.gif\" height=\"400px\"\u003e\n\u003c/div\u003e\n\n**四、上传文本/图片/文档**\n\n- **界面内上传**：点击左下角的附件按钮，可选择拍照、相册、文件方式上传文档\n- **分享上传**：在其他应用（如图库）中选中文本或图片，点击分享按钮，选择本程序\n- **打开上传**：在其他应用（如微信QQ）中选择“打开方式”，选择本程序\n- **拖拽上传**：在支持拖拽的其他应用（微信QQ、超级中转站、电脑多屏协同等）中，拖拽文件到本程序界面\n- **划词上传**：在其他应用中选中文本，选用本程序处理\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/take_photo.gif\" height=\"400px\"\u003e\n\t\u003cimg src=\"readme_img/share_file.gif\" height=\"400px\"\u003e\n\u003c/div\u003e\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/drag_file.gif\" height=\"400px\"\u003e\n\t\u003cimg src=\"readme_img/context_menu.gif\" height=\"400px\"\u003e\n\u003c/div\u003e\n\n**五、智能模板**\n\n通过高级模板语法，可以实现向界面添加下拉选框等操作，具体说明可以在[模板编写说明](template_help.md)中查看\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/template_code.png\" height=\"140px\"\u003e\n\t\u003cimg src=\"readme_img/template_ui.png\" height=\"140px\"\u003e\n\u003c/div\u003e\n\n点击模板编辑页面右上角的按钮，可以加载在线模板列表，在[讨论社区](https://github.com/Skythinker616/gpt-assistant-android/discussions/categories/templates)中可以获取更多模板或分享自己的模板，分享的模板可能会被动态更新到在线模板列表中哦~\n\n**六、支持GPT联网**\n\n通过Function接口允许GPT发起联网请求，程序会向GPT自动返回所需的网页数据，使GPT具有联网能力（需先在设置中允许联网）\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/web_time.png\" height=\"120px\"\u003e\n\t\u003cimg src=\"readme_img/web_weather.png\" height=\"120px\"\u003e\n\u003c/div\u003e\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/web_jd.png\" height=\"180px\"\u003e\n\t\u003cimg src=\"readme_img/web_zhihu.png\" height=\"180px\"\u003e\n\u003c/div\u003e\n\n\u003e 注1：上图均为使用`gpt-3.5-turbo`模型的测试结果，建议在提问前加入“百度搜索”、“必应搜索”、“在线获取”、“从xxx获取”等字样引导GPT，以获得更好的联网效果\n\u003e \n\u003e 注2：如果你使用图中的提问但没有获取到正确的回答，可能是由于GPT的随机性导致访问了错误的网址，或是网站内容变化导致抓取失败，你可以尝试修改提问方式\n\u003e \n\u003e 注3：由于需要将网页内容发送给GPT，联网时会产生大量Token消耗，`gpt-4`模型请谨慎使用\n\u003e\n\u003e 注4：不支持Function的模型（如`gpt-4-vision-preview`等）无法使用联网功能\n\n**七、智能体模式（实验性）**\n\n在主界面启用“智能体”按钮后，AI 可以读取当前屏幕中的控件，并执行点击、滚动、输入文字等操作，可以实现发消息、点外卖、查攻略等高级功能（有待你的探索喔~）\n\n\u003cdiv align=\"center\"\u003e\n\t\u003cimg src=\"readme_img/agent.gif\" height=\"400px\"\u003e\n\u003c/div\u003e\n\n\u003e 注1：该功能仍为实验性能力，不保证所有应用或控件都能稳定识别与操作，且建议选择Agent能力较强的模型。\n\u003e\n\u003e 注2：软件不会保留你的任何信息，但仍建议避免在支付、验证码、密码等敏感页面中使用喔。\n\n---\n\n## 安装\u0026配置\n\n### 1. 下载安装\n\n直接下载最新发行版中的apk文件，安装即可\n\n### 2. 配置 OpenAI\n\n程序使用的是OpenAI API，需要用户在设置中填入自己的API_KEY，可以选择使用官方服务或第三方转发服务\n\n- **使用官方服务**\n\n\t在OpenAI官网注册账号并获取API_KEY，在软件设置中填写网址`https://api.openai.com/`和API_KEY\n\n- **使用第三方转发服务**（国内使用）\n\n\t官方服务在国内无法直接访问，用户可以选择使用第三方转发服务，此处推荐一个提供免费接口的项目[GPT_API_free](https://github.com/chatanywhere/GPT_API_free)，目前其免费服务提供`gpt-3.5-turbo`、`gpt-4o-mini`等模型，限制调用频率不超过200请求/天/IP\u0026Key，在国内可直接访问\n\n### 3. 配置语音识别 (可选)\n\n\u003e 注：程序默认使用的是华为语音识别接口，如无特殊情况，不需要进行此步骤\n\n**百度语音识别接口**\n\n用户可以参照[百度语音识别官方文档](https://cloud.baidu.com/doc/SPEECH/s/qknh9i8ed)注册并创建应用，然后获取AppID、API Key和Secret Key填入设置中\n\n若设置项的“启用长语音”选项关闭，则使用的是百度短语音识别接口，若开启，则使用的是实时语音识别接口，需要用户根据需求在创建应用时勾选对应的服务\n\n此外，在创建应用时，需要将“语音包名”设置为“Android”，并填入本软件包名`com.skythinker.gptassistant`\n\n![设置语音包名](readme_img/asr_set_package.jpg)\n\n**Google语音识别接口**\n\n用户需要确保系统中已安装[Google](https://play.google.com/store/apps/details?id=com.google.android.googlequicksearchbox)软件，然后跟随软件指引设定Google为系统语音识别引擎，且允许其使用麦克风权限，然后在软件设置中选择Google语音识别接口即可\n\n**Whisper语音识别接口**\n\n如果用户所使用的OpenAI接口支持Whisper模型，在软件设置中选择Whisper语音识别接口即可使用\n\n### 4. 开始使用\n\n- 如果你希望使用音量键唤醒，你需要：\n\n\t1. 根据软件提示开启“音量键唤起”无障碍服务，并允许软件在后台运行\n\n\t2. 查看系统设置中是否存在“后台弹出界面”权限，如有该权限则允许，如无则忽略\n\n\t\t\u003e 若发现长按音量下键后手机震动一下但没有弹出界面，大概率是因为缺少该权限\n\n- 如果你希望使用智能体模式，你需要：\n\n\t1. 在系统设置中开启本软件的“智能体模式”无障碍服务\n\n\t2. 选用支持 Function / 工具调用的模型\n\n\t3. 避免在支付、验证码、密码等敏感页面中使用该功能\n\n- 请参照[功能展示](#功能展示)中的操作使用软件\n\n---\n\n## Q\u0026A\n\n### 软件唤起\n\n**Q: 长按音量下键只是在调节音量，并没有其他任何现象？**\n\nA: 请在系统设置中开启本软件的无障碍服务（重启手机后可能需要重新开启）\n\n**Q: 长按音量下键后，手机震动了一下，但没有弹出界面？**\n\nA: 请在系统设置中允许程序“后台弹出界面”权限\n\n**Q: 隔一段时间不用就无法使用音量键唤起了？**\n\nA: 请在系统设置中允许程序在后台运行\n\n### 语音交互\n\n**Q: 语音播报没声音 / 不好听？**\n\nA: 软件调用的是系统自带TTS(Text To Speech)服务，可以通过软件设置项“打开系统语音设置”进入系统设置界面，选择合适的语音引擎；若对系统自带引擎不满意也可以自行安装第三方TTS引擎如讯飞、[TTS Server](https://github.com/jing332/tts-server-android) 等\n\n**Q: 不同接口的语音识别效果有什么差别？**\n\nA: 在中文和中英混说的场景下测试：\n\n- 华为接口（实时语音识别）识别准确度很高，单句识别表现最好\n- 百度则在长句识别时表现很好，断句较为合理，但难以做到中英混合识别（选用的是中文普通话模型）\n- Google支持的语言种类很多，中文识别效果一般，且不会加标点\n- Whisper支持的语言也很多，中文识别效果还可以，但有时出现简繁体不受控的情况，且不支持边说话边输出\n\n在纯英文场景下，华为、Google和Whisper的效果都不错\n\n**Q: 语音识别接口费用如何？**\n\n本软件目前支持以下四种语音识别接口，默认使用的华为接口是免费的：\n\n- **华为HMS**（默认接口）提供免费的语音识别接口，因此程序内置了作者的API Key以供直接使用，如无特殊情况该接口将在华为免费期间一直可用\n- **Google**也是免费接口，但在国内可能无法访问，仅推荐海外用户使用\n- **百度**短语音识别为新用户提供15万次 \u0026 180天免费额度，额度外收取￥0.0034/次的调用费用\n- **Whisper**接口由OpenAI提供，与GPT聊天使用相同接口参数，调用费用可以参考[官方说明](https://openai.com/pricing)\n\n### 联网相关\n\n**Q: 联网时GPT能访问什么网站？**\n\nA: 程序使用Android WebView加载网页，能用本机浏览器打开的网站都可以访问\n\n**Q: GPT能获取网站中的什么内容？**\n\nA: 对于一般网站，仅允许GPT获取纯文本内容，而对于下述特殊适配过的网站，GPT还可以获取到搜索结果链接：百度、必应、谷歌、谷歌学术、知乎、微博、京东、GitHub、B站、知网\n\n\u003e 如果你觉得有其他网站需要适配，可以提交Issue\n\n**Q: 为什么GPT在访问一些网站时说无法获取内容？**\n\nA: 网页加载超时(15s)、需要登录、需要验证等原因都可能导致这个问题，你可以尝试再次提问，或要求GPT更换访问的网站\n\n### 智能体模式\n\n**Q: 开启后为什么AI还是不能操作某些页面？**\n\nA: 部分应用不会向无障碍服务暴露完整控件信息，或当前模型不支持 Function / 工具调用；另外，支付、验证码、密码等敏感页面也不建议交给AI操作。\n\n### 其他使用问题\n\n**Q: 为什么列表中没有我需要的模型？**\n\nA: 软件仅内置了少数常用模型，你可以在设置中添加自定义模型，添加后即会出现在列表中\n\n**Q: 显示获取失败，提示请求超时，或产生错误码502/503？**\n\nA: 排除网络因素，该错误一般由OpenAI接口产生，可能由于其服务器负载过高导致，请重试或等待一段时间后再尝试 [查看OpenAI实时状态](https://status.openai.com/)\n\n**Q: 如何使用非OpenAI格式的模型接口？**\n\nA: 各家LLM接口种类繁多（如Claude、Gemini、Ollama等），本项目暂无计划进行一一适配，用户可以考虑部署[OneAPI](https://github.com/songquanpeng/one-api)或[NewAPI](https://github.com/QuantumNous/new-api)等分发系统将各家接口统一转换为OpenAI格式\n\n### 开发相关\n\n**Q: 编译仓库代码后无法使用华为HMS语音识别？**\n\nA: 为防止滥用，仓库中的Key开启了包名和签名验证，因此如果希望自行编译使用，需要根据[华为官方文档](https://developer.huawei.com/consumer/cn/doc/hiai-Guides/ml-asr-0000001050066212#section699935381711)创建AppGallery应用并替换鉴权信息，包括`app/agconnect-services.json`文件和`app/src/main/res/values/strings.xml`中的`hms_api_key`字段\n\n---\n\n## 主要功能更新日志\n\n- **2023.09.10** 发布第一个版本，支持基础对话、百度语音输入、TTS输出、Markdown渲染等功能\n- **2023.09.13** 支持连续对话、GPT-4、百度长语音识别，上下文菜单唤起\n- **2023.10.06** 添加华为HMS语音识别\n- **2023.11.06** 添加联网功能\n- **2023.12.04** 添加Vision识图功能\n- **2023.12.21** 支持高级模板语法\n- **2024.01.08** 支持Google和Whisper语音识别、在线模板列表\n- **2024.05.25** 支持连续语音对话\n- **2025.04.23** 支持多种文档解析\n- **2026.04.12** 支持智能体模式\n\n---\n\n## TODO\n\n- 支持提问、回复长度限制\n- 支持消息压缩\n- 应用内直接下载安装更新\n\n---\n\n## 测试环境\n\n已测试的机型：\n\n| 机型 | 系统版本 | Android 版本 | 本程序版本 |\n| :--: | :-----: | :----------: | :-------: |\n| 荣耀 7C | EMUI 8.0.0 | Android 8 | 1.9.1 |\n| 荣耀 20 | HarmonyOS 3.0.0 | Android 10 | 1.9.1 |\n| 荣耀 20 | HarmonyOS 4.0 | Android 10 | 2.0.0 |\n| 华为 Mate 30 | HarmonyOS 3.0.0 | Android 12 | 1.6.0 |\n| 华为 Mate 30 | HarmonyOS 4.0 | Android 12 | 1.8.0 |\n| 荣耀 Magic 4 | MagicOS 7.0 | Android 13 | 1.9.1 |\n| 荣耀 Magic 6 | MagicOS 8.0 | Android 14 | 1.11.1 |\n| 荣耀 Magic 6 | MagicOS 9.0 | Android 15 | 3.0.0 |\n| 红米 K20 Pro | MIUI 12.5.6 | Android 11 | 1.5.0 |\n| 红米 K60 Pro | MIUI 14.0.23 | Android 13 | 1.7.0 |\n| 小米 13 | MIUI 14.0.5 | Android 14 | 1.10.0 |\n| Pixel 2 (模拟器) | Android 12 | Android 12 | 1.7.0 |\n\n---\n\n## 改进\u0026贡献\n\n如果你有改进建议或希望参与贡献，欢迎提交Issue或Pull Request\n\n---\n\n## 隐私说明\n\n本程序不会以任何方式收集用户的个人信息，语音输入会直接发送给各语音接口，提问会直接发送给OpenAI API，不会经过其他中间服务器\n\n---\n\n## 引用的开源项目\n\n- [Markwon](https://github.com/noties/Markwon): Android上的Markdown渲染器\n- [chatgpt-java](https://github.com/Grt1228/chatgpt-java): OpenAI API的Java封装\n\n---\n\u003c!--\n## 支持/捐赠\n\n如果你觉得 GPT Assistant 不错，可以点个Star，也可以捐赠请我喝杯奶茶，非常感谢你的支持！\n\n[![Star History Chart](https://api.star-history.com/svg?repos=Skythinker616/gpt-assistant-android\u0026type=Date)](https://star-history.com/#Skythinker616/gpt-assistant-android\u0026Date)\n\n\u003cdetails\u003e\n\t\u003csummary\u003e查看捐赠码\u003c/summary\u003e\n\t\u003cdiv align=\"center\"\u003e\n\t\t\u003cimg src=\"readme_img/wechat.png\" height=\"180px\"\u003e\n\t\t\u003cimg src=\"readme_img/alipay.jpg\" height=\"180px\"\u003e\n\t\u003c/div\u003e\n\t\u003cbr\u003e\n\u003c/details\u003e\n--\u003e\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fskythinker616%2Fgpt-assistant-android","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fskythinker616%2Fgpt-assistant-android","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fskythinker616%2Fgpt-assistant-android/lists"}