{"id":47867071,"url":"https://github.com/yeasy/ai_security_guide","last_synced_at":"2026-05-31T07:02:45.030Z","repository":{"id":337740076,"uuid":"1150169604","full_name":"yeasy/ai_security_guide","owner":"yeasy","description":"从原理到实践，全面掌握大语言模型安全攻防之道","archived":false,"fork":false,"pushed_at":"2026-05-29T07:24:52.000Z","size":1493,"stargazers_count":39,"open_issues_count":1,"forks_count":6,"subscribers_count":1,"default_branch":"main","last_synced_at":"2026-05-29T08:22:37.707Z","etag":null,"topics":["ai","book","guide","llm","security"],"latest_commit_sha":null,"homepage":"https://yeasy.gitbook.io/ai_security_guide","language":"Python","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/yeasy.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null,"notice":null,"maintainers":null,"copyright":null,"agents":null,"dco":null,"cla":null}},"created_at":"2026-02-05T00:50:42.000Z","updated_at":"2026-05-29T07:24:56.000Z","dependencies_parsed_at":null,"dependency_job_id":null,"html_url":"https://github.com/yeasy/ai_security_guide","commit_stats":null,"previous_names":["yeasy/ai_security_guide"],"tags_count":9,"template":false,"template_full_name":null,"purl":"pkg:github/yeasy/ai_security_guide","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/yeasy%2Fai_security_guide","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/yeasy%2Fai_security_guide/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/yeasy%2Fai_security_guide/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/yeasy%2Fai_security_guide/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/yeasy","download_url":"https://codeload.github.com/yeasy/ai_security_guide/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/yeasy%2Fai_security_guide/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":33722156,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-05-26T15:22:16.424Z","status":"online","status_checked_at":"2026-05-31T02:00:06.040Z","response_time":95,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["ai","book","guide","llm","security"],"created_at":"2026-04-04T00:27:41.296Z","updated_at":"2026-05-31T07:02:45.025Z","avatar_url":"https://github.com/yeasy.png","language":"Python","funding_links":[],"categories":[],"sub_categories":[],"readme":"\u003cdiv align=\"center\"\u003e\n\n# 大模型安全权威指南\n\n[![License: CC BY-NC-SA 4.0](https://img.shields.io/badge/License-CC%20BY--NC--SA%204.0-lightgrey.svg)](https://creativecommons.org/licenses/by-nc-sa/4.0/)\n[![GitHub stars](https://img.shields.io/github/stars/yeasy/ai_security_guide?style=social)](https://github.com/yeasy/ai_security_guide)\n[![Release](https://img.shields.io/github/release/yeasy/ai_security_guide.svg)](https://github.com/yeasy/ai_security_guide/releases)\n[![Online Reading](https://img.shields.io/badge/在线阅读-GitBook-brightgreen)](https://yeasy.gitbook.io/ai_security_guide)\n[![PDF](https://img.shields.io/badge/PDF-下载-orange)](https://github.com/yeasy/ai_security_guide/releases/latest)\n\n\u003e 从原理到实践，全面掌握大语言模型的安全攻防之道\n\n\u003cimg src=\"_images/cover.jpg\" width=\"300\" alt=\"AI Security Guide Cover\"\u003e\n\n\u003c/div\u003e\n\n---\n\n## 关于本书\n\n随着 ChatGPT、Claude、Gemini 等大语言模型（Large Language Model，LLM）的广泛普及，人工智能正以前所未有的速度渗透到社会的各个角落。然而，伴随着这场技术革命而来的，是日益严峻的安全挑战。提示注入攻击可以绕过模型的安全护栏，越狱技术能够诱导模型生成有害内容，数据投毒可能在训练阶段埋下隐患，而敏感信息泄露则威胁着用户隐私与企业机密。\n\n本书系统性地梳理了大语言模型安全领域的核心知识，从基础概念到前沿攻防技术，从理论原理到工程实践，旨在帮助读者建立完整的 LLM 安全知识体系。无论是希望了解 LLM 安全风险的技术管理者，还是致力于构建安全 LLM 应用的开发者，亦或是专注于 AI 安全研究的学者，都能从本书中获得有价值的知识与启发。\n\n---\n\n## 目标读者\n\n- **AI/ML 工程师与开发者**：希望在开发 LLM 应用时融入安全设计，避免常见漏洞\n- **安全工程师与渗透测试人员**：需要掌握 LLM 特有的攻击面与防御手段\n- **技术管理者与架构师**：负责制定 AI 安全策略与合规方案\n- **AI 安全研究人员**：关注学术前沿，探索新型攻击与防御方法\n- **对 AI 安全感兴趣的技术爱好者**：希望系统性了解 LLM 安全全貌\n\n---\n\n## 你将学到什么\n\n阅读本书后，你将能够：\n\n1. **理解 LLM 安全的基本概念**\n - 掌握大语言模型的工作原理与安全边界\n - 了解 LLM 安全与传统软件安全的异同\n - 熟悉 OWASP LLM Top 10 等权威安全框架\n\n2. **识别与分析 LLM 攻击手段**\n - 深入理解提示注入、越狱、数据投毒等核心攻击技术\n - 掌握针对智能体系统、RAG 架构的新型攻击向量\n - 学会使用红队测试方法评估模型安全性\n\n3. **构建安全的 LLM 应用**\n - 设计具备纵深防御能力的安全架构\n - 实施输入验证、输出过滤、权限控制等防护措施\n - 部署监控告警与应急响应机制\n\n4. **应对合规与治理挑战**\n - 了解全球 AI 监管格局，包括 EU AI Act、中国《生成式人工智能服务管理暂行办法》等核心法规\n - 建立完善的 AI 治理框架与安全运营体系\n - 平衡安全性、可用性与创新性\n\n---\n\n## 本书特色\n\n- **系统全面**：覆盖 LLM 安全的全生命周期，从训练到部署，从攻击到防御\n- **理论与实践结合**：既有深入的技术原理剖析，也有可落地的工程实践指南\n- **紧跟前沿**：覆盖最新的关键安全研究成果与行业实践，并提供持续更新路径\n- **案例驱动**：通过真实案例帮助读者理解抽象概念\n\n---\n\n## 阅读建议\n\n本书采用循序渐进的结构，建议按顺序阅读：\n\n- **第一部分（第 1-3 章）** 建立基础认知，适合所有读者\n- **第二部分（第 4-7 章）** 深入攻击技术，适合需要了解威胁的读者\n- **第三部分（第 8-10 章）** 聚焦防御实践，适合需要构建安全系统的读者\n- **第四部分（第 11 章与附录）** 治理展望与资源汇总，适合持续学习者\n\n对于时间有限的读者，可优先阅读第 1 章、第 4 章、第 8 章和第 11 章，快速建立整体认知。\n\n---\n\n## 五分钟快速上手\n\n体验第一个提示注入攻击，快速理解 LLM 安全威胁，只需这 3 个步骤：\n\n1. **理解威胁模型（ch1-2）**：了解 LLM 面临的主要安全风险分类，掌握攻击面的全貌（2分钟）\n2. **动手理解注入攻击（ch4）**：阅读并复现第 4 章中的提示注入示例，理解模型如何被“欺骗”突破安全护栏（2分钟）\n3. **学习防御技巧（ch4）**：掌握输入验证、输出过滤等基础防御方法，了解如何保护你的应用（1分钟）\n\n完成这 3 步，你将直观理解为什么 LLM 安全如此重要！\n\n## 学习路线图\n\n```mermaid\ngraph LR\n A[\"\u003cb\u003e安全基础区\u003c/b\u003e\u003cbr/\u003e第1-2章\u003cbr/\u003e原理与威胁模型\"] --\u003e|掌握攻防| B[\"\u003cb\u003e安全工程师\u003c/b\u003e\u003cbr/\u003e第1-6,9章\u003cbr/\u003e攻击技术与防御\"]\n A --\u003e|构建应用| C[\"\u003cb\u003eAI 开发者\u003c/b\u003e\u003cbr/\u003e第1-4,7-8章\u003cbr/\u003e威胁识别与安全编码\"]\n A --\u003e|管理策略| D[\"\u003cb\u003e安全管理者\u003c/b\u003e\u003cbr/\u003e第1-2,9-11章\u003cbr/\u003e治理框架与合规\"]\n A --\u003e|深入研究| E[\"\u003cb\u003e研究人员\u003c/b\u003e\u003cbr/\u003e第1-3,5-6,10章\u003cbr/\u003e前沿攻防与评估\"]\n B --\u003e|应用防御| C\n C --\u003e|组织治理| D\n D --\u003e|学术发现| E\n\n style A fill:#ffccbc\n style B fill:#d84315\n style C fill:#ff7043\n style D fill:#ffab91\n style E fill:#ffccbc\n```\n\n### 学习角色对比\n\n| 角色 | 推荐章节 | 学习重点 | 预期成果 |\n|------|---------|---------|---------|\n| **安全工程师** | 第1-6→9章 | 攻击技术详解、红队测试方法、防御实现、安全架构 | 能够进行全面的 LLM 应用安全评估和加固 |\n| **AI 开发者** | 第1-4→7-8章 | 常见威胁、安全编码实践、工具使用、安全集成 | 在开发过程中内置安全防线 |\n| **安全管理者** | 第1-2→9-11章 | 风险评估框架、治理体系、合规要求、应急响应 | 制定企业 LLM 安全策略 |\n| **研究人员** | 第1-3→5-6→10章 | 攻防原理、新型漏洞、评估方法、学术前沿 | 开展前沿安全研究 |\n\n---\n\n## 作者说明\n\n本书创作于近期，并已完成一轮法规、框架与工具清单校准。由于该领域发展极为迅速，书中部分内容可能随着时间推移而需要更新。建议读者结合附录中的资源列表，持续关注该领域的最新动态。\n\n---\n\n## 推荐阅读\n\n本书是 AI 技术丛书的一部分。以下书籍与本书形成互补：\n\n| 书名 | 与本书的关系 |\n|------|------------|\n| [《零基础学 AI》](https://yeasy.gitbook.io/ai_beginner_guide) | AI 零基础入门，适合缺乏 AI 背景的读者 |\n| [《大模型提示词工程指南》](https://yeasy.gitbook.io/prompt_engineering_guide) | 理解提示词注入攻击的前置知识 |\n| [《大模型上下文工程权威指南》](https://yeasy.gitbook.io/context_engineering_guide) | 深入理解 RAG 安全的上下文工程基础 |\n| [《智能体 AI 权威指南》](https://yeasy.gitbook.io/agentic_ai_guide) | 理解智能体系统的架构，为智能体安全提供背景 |\n| [《Claude 技术指南》](https://yeasy.gitbook.io/claude_guide) | 了解 Claude 的安全设计理念（宪法式 AI）与工具安全 |\n| [《OpenClaw 入门到精通》](https://yeasy.gitbook.io/openclaw_guide) | 智能体框架的安全基线与审计流程实践 |\n| [《大模型原理与架构》](https://yeasy.gitbook.io/llm_internals) | 深入理解大语言模型底层逻辑与架构 |\n| [《智能体 Harness 工程指南》](https://yeasy.gitbook.io/harness_engineering_guide) | 智能体 Harness 层的安全体系设计与沙箱隔离实践 |\n\n---\n\n## 快速开始\n\n### 在线阅读\n\n👉 **推荐**：[GitBook 在线版](https://yeasy.gitbook.io/ai_security_guide/)\n\n### 下载离线版本\n\n本书提供 PDF 版本供离线阅读，可前往 [GitHub Releases](https://github.com/yeasy/ai_security_guide/releases/latest) 页面下载最新版本。\n\n如需获取默认分支自动更新的预览版，可直接下载 [ai_security_guide.pdf](https://github.com/yeasy/ai_security_guide/releases/download/preview-pdf/ai_security_guide.pdf)。该文件会随主线更新覆盖，不代表正式发布版本。\n\n### 本地阅读\n\n先安装 [mdPress](https://github.com/yeasy/mdpress)：\n\n```bash\nbrew tap yeasy/tap \u0026\u0026 brew install mdpress\nmdpress serve\n```\n\n启动后访问 [本地阅读地址](http://localhost:9000) 即可阅读。\n\n---\n\n## 参与贡献\n\n欢迎贡献！您可以通过以下方式参与：\n\n- 🐛 [提交 Issue](https://github.com/yeasy/ai_security_guide/issues) — 报告错误或提出建议\n- 📝 [提交 PR](https://github.com/yeasy/ai_security_guide/pulls) — 改进内容或修复 typo\n- ⭐ Star 本项目 — 帮助更多人发现这本书\n\n---\n\n## 许可证\n\n本书采用 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/) 许可证。\n\n您可以自由分享和演绎，但需署名、非商业使用、相同方式共享。\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fyeasy%2Fai_security_guide","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fyeasy%2Fai_security_guide","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fyeasy%2Fai_security_guide/lists"}