{"id":50707805,"url":"https://github.com/genesislab-io/beatai","last_synced_at":"2026-06-13T23:01:15.788Z","repository":{"id":37307182,"uuid":"442663165","full_name":"genesislab-io/beatai","owner":"genesislab-io","description":"不玩晦涩不搞少数派的 AI 入门圣经，从学生到工程师都能轻松掌握。涵盖神经网络到大模型、顶层设计到微观原理、工程实现到算法基础。 学完后，大家能彻底看懂为什么下一 token 预测这个看似不起眼的能力可以改变世界，也能发现原来 AI 并没有想象中那么神秘、那么高不可攀。 Let's just beat it !","archived":false,"fork":false,"pushed_at":"2026-06-09T04:30:39.000Z","size":353907,"stargazers_count":4679,"open_issues_count":2,"forks_count":257,"subscribers_count":56,"default_branch":"main","last_synced_at":"2026-06-09T05:24:03.368Z","etag":null,"topics":["ai","ai-learning","engineering","llm","neural-network","transformer"],"latest_commit_sha":null,"homepage":"https://beatai.org","language":"JavaScript","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":null,"status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/genesislab-io.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null,"zenodo":null,"notice":null,"maintainers":null,"copyright":null,"agents":null,"dco":null,"cla":null}},"created_at":"2021-12-29T04:52:04.000Z","updated_at":"2026-06-09T03:18:06.000Z","dependencies_parsed_at":"2023-12-11T23:42:58.797Z","dependency_job_id":"b313f3e9-41f2-43fe-a001-324b7fa1a642","html_url":"https://github.com/genesislab-io/beatai","commit_stats":null,"previous_names":["sunface/beat-ai","loong-ai/beat-ai","0xx0-ai/beat-ai","0x-ai/beat-ai","ibeatai/beatai","ibeatai/beat-ai","rustlang-cn/rusty-book","genesismission/beat-ai","opengenesislab/beat-ai","genesislab-ai/beat-ai","beatai-org/beatai","genesislab-io/beatai"],"tags_count":72,"template":false,"template_full_name":null,"purl":"pkg:github/genesislab-io/beatai","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/genesislab-io%2Fbeatai","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/genesislab-io%2Fbeatai/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/genesislab-io%2Fbeatai/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/genesislab-io%2Fbeatai/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/genesislab-io","download_url":"https://codeload.github.com/genesislab-io/beatai/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/genesislab-io%2Fbeatai/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":34303280,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-05-26T15:22:16.424Z","status":"online","status_checked_at":"2026-06-13T02:00:06.617Z","response_time":62,"last_error":null,"robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":true,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["ai","ai-learning","engineering","llm","neural-network","transformer"],"created_at":"2026-06-09T13:00:37.243Z","updated_at":"2026-06-13T23:01:15.780Z","avatar_url":"https://github.com/genesislab-io.png","language":"JavaScript","funding_links":[],"categories":["JavaScript"],"sub_categories":[],"readme":"# BeatAI\n\n\u003e 最近 30 天发布 · 完整列表见 \u003chttps://beatai.org/ai-insights\u003e\n\n### 2026-06-12\n\n- [Claude 动态工作流：通过编排扩展复杂工作](https://beatai.org/ai-insights/claude-dynamic-workflows-scaling-complex-work-through-orchestration?mode=read)  \n  深入探究 Claude 的多智能体编排框架\n- [AI 让市场推广团队更快，却也更困惑、更烧钱](https://beatai.org/ai-insights/observations-on-how-ai-makes-gtm-teams-faster-but-also-confused-and-expensive?mode=read)  \n  人工智能时代对市场推广团队而言是成败攸关的时刻——成败很大程度上取决于如何重新设计人工智能的采用、工具、预算、团队动态和运营模式。\n- [代码没错，但我们看不懂。](https://beatai.org/ai-insights/the-code-was-right-we-couldnt-read-it?mode=read)  \n  如今在工程团队——包括我自己的团队——里，常听到这样一句话。\n\n### 2026-06-11\n\n- [我们是否在构建正确的人工智能？](https://beatai.org/ai-insights/are-we-building-the-right-ai?mode=read)  \n  瓶颈不在于能力，而在于清晰度。\n- [如何使用人工智能准确提取文档中的所有信息](https://beatai.org/ai-insights/how-to-accurately-extract-everything-from-documents-using-ai?mode=read)  \n  要求人工智能模型以特定格式输出会改变一切\n- [“为什么传统用户界面永远不会消亡：GenUI 就是用非常昂贵的流水线生产的传统用户界面。”](https://beatai.org/ai-insights/traditional-ui-is-dead-long-live-traditional-ui?mode=read)  \n  最近一位有权势的人斩钉截铁地告诉我，传统用户界面（UI）正在消亡，用户体验（UX）也将随之被扫进历史的垃圾堆。人工智能（AI）将取代传统的用户体验和用户界面，最终形成所谓的“基因用户界面”（GenUI）。还没等其他人有机会提出有力的反驳，大家就都开始为传统用户界面摇旗呐喊了。老伙计，真舍不得你离开。认识你真好，我们一起度过了美好的时光。\n\n### 2026-06-10\n\n- [Claude Code hooks 详解：提示与生产之间缺失的一层](https://beatai.org/ai-insights/claude-code-hooks-explained-the-missing-layer-between-prompts-and-production?mode=read)  \n  为什么记忆和规则还不够，以及钩子如何在正确的时间强制执行行为。\n- [人工智能定价的秘密](https://beatai.org/ai-insights/the-secret-behind-ai-pricing-most-people-ignore?mode=read)  \n  几周前，我写了一篇文章，解释了价格上涨的原因。\n\n### 2026-06-09\n\n- [token 陷阱：AI 依赖的隐性成本](https://beatai.org/ai-insights/the-token-trap?mode=read)  \n  AI 依赖的隐性成本\n\n### 2026-06-08\n\n- [如何构建持续运行一周的智能体系统](https://beatai.org/ai-insights/building-a-week-long-running-agentic-system?mode=read)  \n  持久性是一种工程特性，而非模型性能。\n- [开源模型已经够好了，别再为用不上的智能付溢价](https://beatai.org/ai-insights/open-source-models-are-good-enough-stop-overpaying-for-intelligence-you-dont-need?mode=read)  \n  而且，要做好准备，以防智能成本高到无法承受。\n- [SkillOpt 详解：从提示工程到技能训练](https://beatai.org/ai-insights/skillopt-explained-from-prompt-engineering-to-skill-training?mode=read)  \n  深入剖析 SkillOpt 的框架、实验结果和开源实现\n- [AI 原生产品的 5 个指标层级](https://beatai.org/ai-insights/the-metric-playbook-for-ai-pms-five-layers-four-practices-one-checklist?mode=read)  \n  “改进”AI产品意味着什么？\n- [这款中国新 AI 会让你思考](https://beatai.org/ai-insights/this-new-chinese-ai-will-make-you-think?mode=read)  \n  这就是中国与美国竞争的方式。\n\n### 2026-06-04\n\n- [Agentic AI：数据碎片化与 LLM 推理的双重挑战](https://beatai.org/ai-insights/agentic-ai-for-industrial-iot-use-cases?mode=read)  \n  面向工业物联网系统的 AI agent\n- [不要被动反应，要主动回应：我们为何重构了 SDLC 来守住专注](https://beatai.org/ai-insights/dont-react-respond-why-we-rebuilt-our-sdlc-for-focus?mode=read)  \n  创业文化建立在多任务并行之上，可人脑不是这么造的。本文讲讲我们怎样重新设计 Ewake 的 SDLC，不惜代价守住团队的专注力。\n- [用 LLM-as-a-Judge 评估 Netflix 剧集简介](https://beatai.org/ai-insights/evaluating-netflix-show-synopses-with-llm-as-a-judge?mode=read)  \n  会员登录 Netflix 后，最难的选择之一就是看什么。难点不在于选择太少——片库里有成千上万部作品——而在于，要从中找到最吸引人的那一部，既复杂又高度因人而异。为此，我们会向会员推送个性化推广素材，其中尤其重要的是剧集简介——一段简短的描述，点出关键剧情，并给出类型、主创等线索。\n- [AI 平台之争已经打响](https://beatai.org/ai-insights/the-ai-platform-wars-have-started?mode=read)  \n  Anthropic 本周发布 Claude Managed Agents，是迄今为止表明 AI 市场进入新阶段的最明确信号。这不只是又一次模型发布，而是 Anthropic 从卖智能转向卖执行基础设施：安全沙箱、长时运行会话、编排和治理，并把这些和 Claude Code 等现有产品串到一起。\n\n### 2026-06-03\n\n- [AI token 稀缺与街机经济学](https://beatai.org/ai-insights/ai-token-scarcity-and-arcade-economics?mode=read)  \n  算力成本节节攀升，逼着设计师重新掂量自己的预期。\n- [把 Claude Code 改造成多 agent 工程流水线：一套跑了几个月的生产级 agent harness 实录](https://beatai.org/ai-insights/building-a-production-agent-harness-turning-claude-code-into-a-multi-agent-engineering-pipeline?mode=read)  \n  一个孤立的编码 agent，本质上是泡在罐子里的大脑。它会思考、会生成代码、会调函数——但它没法在凌晨三点回你的 Slack 私信，没法重跑一个挂掉的 CI，没法处理刚冒出来的 merge 冲突，也记不住昨天某位 reviewer 提的问题至今还没人答。\n- [用强化学习控制机械臂为人体按摩](https://beatai.org/ai-insights/controlling-a-robotic-arm-for-massaging-human-body-with-rl?mode=read)  \n  用交互式强化学习实现最优行为\n- [游戏 AI 的关键不在于智能](https://beatai.org/ai-insights/game-ai-is-not-about-intelligence?mode=read)  \n  有那么一类反复出现的内容——游戏开发者大会的演讲、博客文章、Twitter 长帖——总有人哀叹游戏 AI 相比现代机器学习\"落后了\"。叙事方式几乎一模一样：AlphaGo 击败了世界冠军，GPT-4 能写代码，可我们的 NPC 还在往墙上撞、在空地上找掩体。为什么这道鸿沟一直没填上？游戏 AI 怎么会这么原始？\n- [体面地使用 AI 的若干准则](https://beatai.org/ai-insights/guidelines-for-respectful-use-of-ai?mode=read)  \n  随着公司纷纷采用 AI 工具，大量时间被花在从安全、合规乃至成本角度去思考 AI 政策上。但很多管理者都忽略了一件事：在团队这个整体的语境里，自己的成员到底应该如何与 AI 协作。这留下了许多悬而未决的张力，是时候让管理者站出来定一些准则了——不只是规定怎样使用 AI 才算\"获批\"，还要规定怎样使用 AI 才算体面。\n- [AI 螺旋：找到你与 AI 共同进化的阶段](https://beatai.org/ai-insights/the-ai-helix-identify-your-stage-of-ai-co-evolution?mode=read)  \n  如果你大量时间都花在写 prompt、检查每一条 AI 输出、修正错误上——那你是在对 AI 做微观管理。绝大多数人都是从这里起步的。\n- [科技行业自找的清算。又一次。](https://beatai.org/ai-insights/the-reckoning-the-tech-industry-had-coming-again?mode=read)  \n  2007 年，我在澳大利亚墨尔本做 IT 咨询。那段时间经手的项目很多，其中一次，是替一家美国大型金融公司替换他们的汽车金融应用，尤其是我跟他们那位支持工程师打交道的经历，给了我一个至今难忘的行业视角。\n- [你家的猫比 ChatGPT 更懂这个世界——一位 AI 教父刚刚为此离开了 Meta](https://beatai.org/ai-insights/your-cat-understands-the-world-better-than-chatgpt-and-one-of-ais-godfathers-just-quit-meta-over?mode=read)  \n  我叫 Deepak Kumar，是个软件工程师，老是在技术的各个角落里反复爱上又厌倦。我之所以写东西，是因为只有把一件事讲给陌生人听，才能真正搞清楚自己到底有没有弄懂。所以别把这篇当成讲座，就当是你坐到我对面，问了一句\"等等，现在 AI 圈到底在吵什么？\"，我们随便聊聊。\n\n### 2026-06-02\n\n- [上下文工程，才是新的护城河](https://beatai.org/ai-insights/context-engineering-is-the-new-moat?mode=read)  \n  几个月前我有了一个想分享的领悟。打造 NomNow（一款支持多模态记录的对话式 AI 卡路里追踪应用）以来，这是我撞见过的最有用的一套思考框架。\n- [我如何把相册变成一个自主 AI Agent——完整指南](https://beatai.org/ai-insights/how-i-turned-my-photo-gallery-into-an-autonomous-ai-agent-the-complete-guide?mode=read)  \n  读完这篇指南，你会拥有一个完全跑在自己机器上的端到端 agent。你可以丢给它一句话，比如\"那张暖暖的黄金时刻照片，就是旅途中我们在路边小饭馆停下来那次拍的\"，它能在 100 毫秒内从相册里把图找出来——整个过程内存占用不到 1 GB，花费精确地是零美元。\n- [LLM-as-a-Judge：用大模型来做评估](https://beatai.org/ai-insights/llm-as-a-judge-using-llms-for-evaluation?mode=read)  \n  LLM-as-a-Judge，以及在人工质量评分之外其他可扩展的补充手段……\n- [通往 Multi-Head Latent Attention 之路](https://beatai.org/ai-insights/the-journey-to-multi-head-latent-attention?mode=read)  \n  人人都在谈 transformer 怎么扩展（scale），谈它怎么记忆的人却少得多。但实话说，对今天任何一个跑在生产里的 LLM 来说，KV cache 才是说了算的那个——它决定你的上下文长度、吞吐量、GPU 账单，以及你能部署在什么样的硬件上。Multi-Head Latent Attention（MLA）出自 DeepSeek-V2，是我见过对这个瓶颈最优雅的一次进攻。\n\n### 2026-05-29\n\n- [AI 把一个荒唐点子夸成\"真有意思\"，一位记者现在正在推广它](https://beatai.org/ai-insights/ai-called-an-absurd-idea-genuinely-interesting-a-reporter-is-now-promoting-it?mode=read)  \n  词语的魔法是怎么生效的——哪怕这些词压根没意义。\n- [Claude Opus 4.8 实战指南：四个让你重新规划工作流的新特性](https://beatai.org/ai-insights/claude-opus-4-8-4-features-that-change-our-daily-work-with-claude?mode=read)  \n  模型本身只是温和升级，但 effort control、动态工作流、Messages API 可在运行中改指令，加上一个肯承认\"我没把握\"的 Claude——这次发布真正的份量在外围。\n- [写给普通人的上下文窗口：AI 是怎么跟丢思路的](https://beatai.org/ai-insights/context-windows-for-humans-how-ai-loses-the-thread?mode=read)  \n  以及，为什么每一次 AI 对话都存在一个边界\n- [Distill：一位前同事的故事](https://beatai.org/ai-insights/distill-the-story-of-an-ex-colleague?mode=read)  \n  公司想在你离职前把你\"萃取\"下来。看看他们真正能拿到什么。\n- [怎样写出 coding agent 真正能落地的功能规格](https://beatai.org/ai-insights/how-to-write-feature-specs-that-coding-agents-can-actually-implement?mode=read)  \n  为什么 agentic coding 靠的是确定性契约，而不是模糊需求加 prompt 撞大运\n- [Claude Code Dynamic Workflows：把编排逻辑搬进代码的新原语](https://beatai.org/ai-insights/riba2534-2060102236676792711?mode=read)  \n  5 月 28 日，Anthropic 发布了 Claude Opus 4.8，随之而来还带来了一个新功能——Dynamic Workflows（动态工作流）。\n\n### 2026-05-28\n\n- [Demo 跑得通 ≠ 生产跑得通：构建 AI agent 时如何驾驭 LLM 的不确定性](https://beatai.org/ai-insights/demo-works-production-works-how-to-harness-llm-uncertainty-when-building-ai-agents?mode=read)  \n  距离我的 AI 产品 NomNow 上线还有几周——这是一款支持多模态记录的对话式 AI 卡路里追踪器——我给一位朋友做了一次快速演示。他说了一句话：\"I had a chicken sandwich for lunch\"（午餐吃了个鸡肉三明治），看着 app 完成转录、识别食物、估算卡路里、记入日志，整个过程不到三秒。他抬起头说：\"this is magic.\n- [用百万分之一的成本训练 AI](https://beatai.org/ai-insights/training-ais-for-a-millionth-of-the-cost?mode=read)  \n  低成本训练 AI 的新路子？\n- [AI 原生工程团队的协作方式，第一部分：当交接链条崩塌时](https://beatai.org/ai-insights/ways-of-working-for-ai-native-engineering-teams-part-1-when-the-handoff-chain-collapses?mode=read)  \n  AI 原生工程团队的协作方式，第一部分：当交接链条崩塌时。在我作为工程负责人和顾问的大部分职业生涯中，一直围绕一条交接链条来组织工程团队……\n\n### 2026-05-27\n\n- [Agent Harness 剖析](https://beatai.org/ai-insights/the-anatomy-of-an-agent-harness?mode=read)  \n  一个 ReAct loop、几个工具、一段写得不错的 system prompt——demo 阶段往往能撑得出奇地远。\n\n### 2026-05-26\n\n- [用 250 行 Python 造一个本地的浏览网页 LLM agent](https://beatai.org/ai-insights/build-your-own-local-web-browsing-llm-agent-in-250-lines-of-python?mode=read)  \n  这篇文章里，我会演示如何给本地的 LLM agent 装上一个真正的网页浏览器。读完之后，agent 就能拿到一个问题、上网搜一篇相关页面、在隐身浏览器里打开它、读它的内容，并基于它真正看到的东西作答。\n- [DS-STAR：Google 是怎么造出一个真正能用的数据科学 agent 的](https://beatai.org/ai-insights/ds-star-how-google-built-a-data-science-agent-that-actually-works?mode=read)  \n  agentic coding 工具我已经用了大约两年（Claude Code 已经认真且持续地用了一年）。在通用工程任务上确实让人眼前一亮。但每当我把它推向真正的数据科学场景时，就总能撞上同一个摩擦点：Claude 的分析基本停留在算几个平均值——这些数字本身有用，但缺少一个数据科学家应有的纵深（分布对比、p 值、置信区间、数据质量等等）。\n- [假如 2026 年从头学机器学习，我会怎么做](https://beatai.org/ai-insights/how-id-learn-machine-learning-in-2026?mode=read)  \n  我现在是 Twitch 的资深 Applied Scientist，已经做了七年的生产级 ML 系统部署。如果让我在 2026 年的今天从零重来一次，我几乎不会按当初的任何方式去走。\n- [Prompt Engineering 的现代进展](https://beatai.org/ai-insights/modern-advances-in-prompt-engineering?mode=read)  \n  由于使用门槛极低，LLM 迎来了爆炸式的流行。哪怕完全不懂深度学习的人，只要写一段文本 prompt，就能调动起庞大的神经网络去快速解决各种复杂问题。随着指令跟随能力的改进和对齐技术的进步，这些模型变得越来越好用。然而，给 LLM 写出有效的 prompt，既是一门艺术，也是一门科学——仅仅是对 prompt 的实现方式或策略做一些细微调整，就能带来显著的性能提升。…\n\n### 2026-05-23\n\n- [代码并不便宜：用软件基本功放大 AI 的产出](https://beatai.org/ai-insights/code-is-not-cheap-how-to-multiply-your-ais-output-with-software-fundamentals?mode=read)  \n  2025 年 2 月，Andrej Karpathy 造了个词：\"vibe coding\"——说出你想要什么，让 AI 写代码，然后把代码忘掉。这个说法迅速火了。所有人都愿意相信，写代码已经像说话一样轻松。\n- [从鸢尾花到反向图搜：K-Nearest Neighbors 是怎么撑起现代 AI 的](https://beatai.org/ai-insights/knn-distance-metrics-choosing-k-modern-ai-explained?mode=read)  \n  For You 页面、Spotify Discover Weekly、你做过的每一次反向图片搜索、ChatGPT 内部的检索——它们背后的算法，比彩色电视还要老。1951 年由 Evelyn Fix 和 Joseph Hodges 在一份美国空军技术报告里提出，从未被真正取代过。\n- [AI PM 的菜单：成本与质量权衡的实战指南](https://beatai.org/ai-insights/the-ai-pms-menu-a-field-guide-to-cost-quality-tradeoffs?mode=read)  \n  我在创业。NomNow 是一款多模态 AI 营养师，现已上架 App Store。一路做下来，要说最想塞给年轻一点的自己读的那条经验，就是：对一家基于 LLM 的初创公司而言，成本纪律不是优化，是生存。\n- [你的 AI agent 能读懂代码库，却不懂你的产品](https://beatai.org/ai-insights/your-ai-agent-can-read-your-codebase-it-doesnt-know-your-product?mode=read)  \n  我让 AI agent 给我们的产品头脑风暴一些新功能。不到一分钟它就甩回一份整齐的清单：通知中心、动态流、带分析 widget 的 dashboard、新手引导向导。功能本身都挺合理，但没有一个对得上我们的产品。\n\n### 2026-05-22\n\n- [构建一套 agent harness](https://beatai.org/ai-insights/building-an-agent-harness?mode=read)  \n  Prompt engineering、context engineering，现在轮到 harness engineering。\n- [从零构建 Claude：Anthropic 思考引擎背后的 62 个组件](https://beatai.org/ai-insights/building-claude-from-scratch-62-components-behind-anthropics-thinking-engine?mode=read)  \n  实践中构建 agentic 系统时，AI 模型本身早已不再是瓶颈，真正的瓶颈是它们外面那层 harness。Anthropic 花了两年时间为 Claude 打造那层 harness——也就是那套编排代码：挑选合适的工具，并在宣告成功之前为自己的工作打分。…\n- [深度学习需要矩阵，原因和 Instagram 需要滤镜一样](https://beatai.org/ai-insights/deep-learning-needs-matrices-for-the-same-reason-instagram-needs-filters?mode=read)  \n  上学的时候，矩阵是我最喜欢的主题。我学得很快，也许你也一样。\n- [在 Netflix 让机器学习人人可用：构建模型生命周期图谱](https://beatai.org/ai-insights/democratizing-machine-learning-at-netflix-building-the-model-lifecycle-graph?mode=read)  \n  随着 Netflix 不断成长，机器学习持续支撑着 Netflix 向会员交付价值、在多个业务领域追求卓越。十多年前 Netflix 刚开始投入机器学习时，主要聚焦单一领域：个性化推荐。当时 Scala 是行业标准，ML 团队规模相对较小，优化会员参与度是主要用例。快进到今天，机器学习已成为 Netflix 业务转型的支柱。如今 ML 已应用到各个业务领域，包括：\n- [简明讲清 Diffusion LLM](https://beatai.org/ai-insights/diffusion-llms-explained-simply?mode=read)  \n  基于 LLM 的聊天机器人在我们身边随处可见。它们回复时，是按顺序逐步生成内容的。也就是说，它们的输出是一个 token 接一个 token、一次一个地生成出来的。\n- [Anthropic 高速增长的阴暗面](https://beatai.org/ai-insights/the-dark-side-of-anthropics-growth?mode=read)  \n  在很多人眼里,Anthropic 是硅谷有史以来最动人的故事。这家公司五年前才成立,如今却有望在今年年底把年化收入做到 1000 亿美元。\n- [用计算机科学概念解读 Claude Code 泄露的 source map](https://beatai.org/ai-insights/using-computer-science-concepts-to-analyze-claude-codes-leaked-source-map?mode=read)  \n  这个故事现在大家都知道了。\n\n### 2026-05-21\n\n- [代码变便宜了，判断力没有。](https://beatai.org/ai-insights/code-got-cheap-judgement-did-not?mode=read)  \n  关于 AI 与工程，主流的说法是它降低了门槛。如今一个初级工程师配上趁手的工具，就能做过去中级工程师才能做的事。一个中级工程师能做过去资深工程师才能做的事。金字塔被压扁，组织架构变得更扁平，顶端那些经验丰富的工程师变得不那么不可或缺了——因为他们过去提供的杠杆，现在已经被烤进了工具里。\n- [提升广告相关性：把实时上下文融入序列推荐模型](https://beatai.org/ai-insights/enhancing-ad-relevance-integrating-real-time-context-into-sequential-recommender-models?mode=read)  \n  在此前的一篇文章 Ads Candidate Generation using Behavioral Sequence Modeling（原文）中，我们介绍过一个候选生成器（CG）。它用一个基于 Transformer 的双塔模型，借助用户的站外转化历史——这是一个很强的信号——来预测用户未来会与哪些广告主、哪些具体商品发生交互。…\n- [我们如何为 6 万名知识工作者打造 AI 第二大脑](https://beatai.org/ai-insights/how-we-built-an-ai-second-brain-for-60k-knowledge-workers?mode=read)  \n  Meta 的知识工作者每天都在跟工作流的碎片化作斗争：会议记录、任务、关键决策、代码上下文这些重要信息，散落在彼此割裂的平台上。每开启一段新的 AI 对话，都得从零冷启动——重复同样的解释、贴同样的链接、花同样的十分钟铺垫上下文，真正的工作才能开始。\n- [LLM 弃用与迁移策略：如何应对不断上涨的 AI 价格](https://beatai.org/ai-insights/llm-deprecation-and-migration-strategy-how-to-adapt-to-rising-ai-prices?mode=read)  \n  模型退役是 AI 市场的一种结构性现实，不是罕见的运维事件。OpenAI（GPT）、Anthropic（Claude）、Google（Gemini）以及其他 LLM 供应商，会频繁弃用某些特定的 API 版本，转而推出更新的模型。\n- [MIRAS：Transformers、Mamba 与 Titans 背后的设计蓝图](https://beatai.org/ai-insights/miras-the-blueprint-behind-transformers-mamba-and-titans?mode=read)  \n  我们用来让语言模型记得更好的那些精巧机制——门控函数、权重衰减、自适应遗忘——结果都只是同一个底层原理的不同实例，这个原理就是保留门（retention gate）。\n- [拥有你自己的 Harness](https://beatai.org/ai-insights/own-your-harness?mode=read)  \n  过去几个月里，我写了几篇关于 agent harness 的文章，也写了为什么所有人似乎都聚焦于它。一句话总结就是：它是新的前沿。没错，大家仍在模型这条战线上厮杀（比如 DeepSeek 刚发布了 v4，OpenAI 发布了 GPT-5.5，Anthropic 拿 Mythos 把所有人吓得不轻），但真正的战斗将发生在 harness 上。\n- [Snake Coding](https://beatai.org/ai-insights/snake-coding?mode=read)  \n  用提示词写代码是有诱惑力的。这种诱惑并不只是新工具的副产品，它恰恰塑造着未来。每一波技术生产力的浪潮都伴随着某种形式的诱惑。五十年前也不例外：当时，用汇编写代码逐渐被 FORTRAN 和 COBOL 取代，至少是被它们覆盖。那时，一个新的表述层级取代了直接面向机器的方式。\n- [为什么 AI 修不好客户服务](https://beatai.org/ai-insights/why-ai-cant-fix-customer-service?mode=read)  \n  客户服务是企业版的道歉，可企业看不到这一点。它在大多数时候还高度情绪化，这一点企业多少能看到，却很难做得有效。正是这两件事，构成了 AI 工具——无论是 LLM 还是生成式 AI——至今没能真正取代客户服务、也许永远做不到的根源。\n\n### 2026-05-20\n\n- [智能体 AI 安全模式](https://beatai.org/ai-insights/agentic-ai-security-patterns?mode=read)  \n  智能体 AI 系统的关键特征是自主性和推理能力。凭借这两点，它们能把复杂任务拆解成更小的可执行任务，再编排这些任务的执行，并在需要时监控、反思、适配乃至自我纠错。正因如此，\n- [超越代码生成：让 AI 覆盖完整的数据科学工作流](https://beatai.org/ai-insights/beyond-code-generation-ai-for-the-full-data-science-workflow?mode=read)  \n  最近我一直被一种挥之不去的 AI FOMO 笼罩。每天都能看到有人分享 AI 技巧、晒出自己造的新智能体和技能，还有各种凭感觉写出来的应用。我越来越意识到，对今天的数据科学家来说，快速适应 AI 已经成了保持竞争力的硬性要求。\n- [仅解码器 Transformer：生成式 LLM 的主力架构](https://beatai.org/ai-insights/decoder-only-transformers-the-workhorse-of-generative-llms?mode=read)  \n  当下 AI 研究的步伐令人瞠目。跟上最新的论文很难，连领域内的专家都会觉得自己没能掌握这个不断演化的前沿里那些更细微的细节。LLM 领域尤其如此，有影响力的研究层出不穷：新的基础模型（如 Gemma \\[15\\] 和 OLMo \\[12\\]）、更好的对齐技术（DPO \\[32\\]、PPO \\[33\\]、REINFORCE \\[34\\] 之争），还有 模型合并 这类相对冷门的话题。…\n- [读懂 DeepSeek-V4 之前，先把基础打牢](https://beatai.org/ai-insights/deepseek-v4-and-before-getting-the-foundations-right?mode=read)  \n  2025 年 1 月，DeepSeek-R1 发布，同时开源了蒸馏版的「32B 与 70B 模型，性能与 OpenAI-o1-mini 相当」。接下来那一周，几家 AI 巨头的股价应声暴跌。\n- [从原型到预测：用随机森林实时归类 NBA 球员](https://beatai.org/ai-insights/from-archetypes-to-predictions-using-random-forest-to-classify-nba-players-in-real-time?mode=read)  \n  读过我上一篇文章的人都知道，我用 K-Means 聚类论证过一个观点：传统的 NBA 位置基本已经过时。数据找出了五种自然的球员原型，它们和一个人被登记成后卫还是前锋毫无关系。这个发现很有意思，但它也留下了一个明摆着的后续问题：好，那现在怎么办？如果一位球队管理层的分析师想知道某个球员属于哪种原型，难道每次都得把整套聚类流程重跑一遍？那不现实\n- [AI 如何记忆，又为何遗忘：第 1 部分，上下文问题](https://beatai.org/ai-insights/how-ai-remembers-and-why-it-forgets-part-1-the-context-problem?mode=read)  \n  AI 编程。我姑且假设你到现在至少试过了。你大概用过 Claude 或 Cursor 这类工具，试过不同的模型，说不定还用 Anthropic 或 OpenAI API 自己搭过东西。被迫为超额的 token 付费时，你可能哭过一小会儿，而“agents”这个词到现在大概一听就让你头疼。如果你完全不知道我在说什么，那请把你星球的坐标发给我——那里一定特别宁静。\n- [怎样才能更好地给葡萄酒品质分类？](https://beatai.org/ai-insights/how-do-we-classify-wine-quality?mode=read)  \n  评定葡萄酒品质的度量标准，在资深评审之间常常对不上号。同一款酒，不同专家给出的分数可能相差悬殊；而酒一旦装瓶待售，就再也无法因评价结果而改变。这种事浪费时间和资源，在行业里几乎每天都在上演。\n- [我建了一座\"证据工厂\"，因为\"相信我，agent 没问题\"算不上治理策略](https://beatai.org/ai-insights/ive-built-an-evidence-factory-because-trust-me-the-agent-is-fine-is-not-a-governance-strategy?mode=read)  \n  关于企业 agent 化，我写下的东西已经足够填满一本小书——一本会让翻开它的 AI 架构师怀疑自己职业选择的、令人不太舒服的书。流程选择、35% 的自动化天花板、agentic 架构模式、治理哲学、大规模运行一座 AI 工厂的经济学，我都用一种好为人师的口吻讲了个遍，也亲眼看着足够多的项目失败，因而挣得了发表观点的资格。\n- [Anthropic 新推出的金融 Agent 究竟有何不同](https://beatai.org/ai-insights/what-makes-anthropics-new-finance-agent-different?mode=read)  \n  5 月 5 日，Anthropic 为金融服务业开源了 10 个 agent 模板。媒体报道的焦点是那笔与 Blackstone 和 Goldman Sachs 合作、价值 15 亿美元的华尔街合资项目。Jamie Dimon 对记者说，Claude 在 20 分钟内为他做出了\"一个巨大的仪表盘，配齐了所有支撑材料和所有研究\"。\n- [当你的 AI 治理模型试图监管一个智能体蜂群](https://beatai.org/ai-insights/when-your-ai-governance-model-tries-to-regulate-an-agentic-swarm?mode=read)  \n  我小时候对组合逻辑很感兴趣。是的，这件事很大程度上解释了我后来为什么变成这样，也解释了为什么我的小学老师看我的眼神，活像人们看一只学会了开冰箱的狗。\n\n### 2026-05-19\n\n- [Anthropic 的工程师说 \"干掉 Markdown\"，他真正想表达的是什么。](https://beatai.org/ai-insights/anthropics-engineer-said-kill-markdown-here-s-what-he-actually-meant?mode=read)  \n  上周，Claude Code 的工程负责人告诉开发者们：别再输出 Markdown 了。整个互联网炸了。\n- [不用更好的模型，也能造出更好的 AI](https://beatai.org/ai-insights/better-ai-without-a-better-model?mode=read)  \n  我第一次玩 LLM（大语言模型）时，让我印象最深的一个主要瓶颈是：它们本质上是静态函数，接收输入、吐出回应。能力已经被权重锁死。能微调或后训练，是的，但实时学习、对新输入做出适应，完全不行。一些批评者拿这一点当作\"它其实不是真智能\"的证据，因为不像人类智能那样能实时学习与成长，LLM 基本上是冻结在时间中的。我当时没怎么深想，就接受了它们的样子。\n- [为一团中等规模的混乱编写架构文档](https://beatai.org/ai-insights/documenting-architecture-of-a-mid-size-chaos?mode=read)  \n  写软件架构文档很可怕。尤其是在一家没有架构师角色或部门的中型公司。光是想一想公司信息系统的架构，看起来就如此\"多余\"和\"拖我们后腿\"。然而中型公司一次又一次最终陷入重复的系统、重复的数据，以及一团混乱。\n- [Harness：企业被打造来迎接的时代](https://beatai.org/ai-insights/harness-the-era-enterprises-were-built-for?mode=read)  \n  这是一个关于\"终端用户如何把语言模型当作黑盒（我们只能控制输入什么、以及对输出做什么）来提升其性能\"的故事。从最简单的做法，一路到提升模型性能的复杂变通方案。\n- [预测墨尔本一家紧急护理诊所的日就诊量](https://beatai.org/ai-insights/predicting-daily-patient-volume-for-a-melbourne-urgent-care-clinic?mode=read)  \n  经营一家走入式紧急护理诊所有一个反复出现的运营头痛：要决定某一天该排多少临床医生。如果排得太少，候诊室就可能堵塞，患者会流向最近的急诊科 (ED)。反过来，你又得为不需要的医生工时买单，反之亦然。大多数诊所基于去年的数字、直觉和一点猜测来估算就诊人数，特别是在流感季前后。…\n- [两支团队，一次转向：AI 如何重塑我们的产品设计流程](https://beatai.org/ai-insights/two-teams-one-shift-how-ai-is-rewiring-our-product-design-process?mode=read)  \n  随着 AI 在\"造一切\"上越来越强，设计师工作里哪一部分变得更重要，哪一部分变得不那么重要？过去一年，DoorDash 的两支团队一直在探索这一概念。在本文中，Qixing 将把两个案例研究串起来，讲讲产品开发流程是如何转变的、观察到了哪些新模式、做了哪些实验、又有哪些问题尚未解决。\n\n### 2026-05-18\n\n- [云端蚁群](https://beatai.org/ai-insights/cloud-ant-colonies?mode=read)  \n  科学、数学和工程中最美的东西，很多都不是被发明出来的。它们是被发现的——早已在自然界中运行着、早已最优、早已优雅，只等着我们去注意到它们、把它们写下来。\n- [我们已经走到 legacy code 的尽头了吗？](https://beatai.org/ai-insights/have-we-reached-the-end-of-legacy-code?mode=read)  \n  让软件演化并不简单。每一次改动都意味着把新代码与既有代码集成在一起，而那并不总是容易的。既有代码通常没有预见到未来的改动，即便预见到了，也从来不会正好就是必须做出的那些改动。所以你必须沿途不断地更新和清理。\n- [官方文档没告诉你的 Claude Code skills 真相](https://beatai.org/ai-insights/what-the-docs-dont-tell-you-about-claude-code-skills?mode=read)  \n  这个月，我为自己 newsletter 写作 pipeline 的每一个环节都构建了一个 skill。\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fgenesislab-io%2Fbeatai","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fgenesislab-io%2Fbeatai","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fgenesislab-io%2Fbeatai/lists"}