给超级 AGI 做产品太容易了——难的是现在

与 Boris 搭档：80% 心灵感应，20% 各干各的

Boris 是 Claude Code 的创造者和技术负责人。Cat 用 "80% mind-meld" 形容他们的关系。Boris 擅长方向感——三个月后、六个月后产品应该长什么样，那个最 AGI pilled 的版本是什么。Cat 的角色是把愿景翻译成执行路径：从现在到那个愿景之间，每一步怎么走。

剩下的 20% 是各自特别在意的事情——谁更在意谁就推。这种模糊分工看起来不太正统，但正因为模糊，才能快。

编者注

Boris Cherny 也是 O'Reilly《Programming TypeScript》的作者。他 2024 年 9 月加入 Anthropic 后构建了 Claude Code 的第一个终端原型。"AGI pilled"源自"red pilled"（《黑客帝国》），指对 AGI 即将到来持狂热乐观态度。

面试几百个 PM 后：大多数人还活在旧世界

Cat 面试了几百人，发现大多数人对 AI PM 角色的理解方向不对。

AI 出现之前技术变化很慢，PM 做 6-12 个月的规划，代码写起来很贵，核心工作是协调各团队的路线图。但现在模型能力快速提升，很多功能的交付时间从 6 个月变成 1 个月，有时候 1 周，甚至 1 天。PM 不应该花精力对齐多季度路线图，而应该想：怎么最快把东西推出去？

最好的 AI 产品 PM，能缩短从「有这个想法」到「产品到了用户手里」的时间，并且能定义出产品必须在哪些任务上开箱即用。

— Cat Wu

怎么做到一天出一个功能

第一，设定清晰目标。大语言模型能力太通用，用户是谁、解决什么问题全都模糊。好的 PM 能把这些定死：核心用户是企业开发者，这个功能解决权限提示疲劳感。目标一旦清楚，就排除了大量方案。

第二，Research Preview 机制。几乎所有功能都先以研究预览形式发布——明确告诉用户这是早期产品、在收集反馈、可能不会永远支持。一两周就能出货。

第三，"evergreen launch room"。工程师觉得功能准备好了，发到这个频道里，文档和市场团队直接跳进来，第二天就完成对外宣传。搭建这套发布流水线，就是 PM 该干的事。

编者注

有人做过日历统计，Anthropic 在 2026 年前几个月几乎每天都有一个重要功能或产品发布。这不是偶然——这正是 Cat 描述的这套系统的直接产出。

PRD 没死，但活法不同了

第一，每周做严格的 metrics readout，整个团队一起看数据，确保每个人都深度理解业务。

第二，维护一份 team principles——谁是核心用户、为什么是他们、愿意做什么取舍。让团队每个人能自己做决策，不等 PM 拍板。

PRD 对特别模糊的功能和需要大量基础设施的长期项目还是会写。但大部分功能不需要。

不是最强模型让他们变快的

Cat 的回答很直接：他们已经快了好几个季度了，新模型不是核心原因。更大的原因是流程和团队期望——每个人都觉得自己有权力也有责任把想法在一周内变成现实。

源代码泄露：定性为流程失败

2026 年 3 月底，Claude Code 完整源代码通过 npm 包泄露。原因是人为错误——有人用 Claude 写了一个关于包发布流程更新的 PR，经过两层审查但还是漏了。Cat 定性为流程失败，涉事员工仍在公司。

编者注

根本原因是 Bun 运行时默认生成 source map 文件，而 .npmignore 缺少 *.map 条目，导致 59.8 MB 的 source map 发布到公共 npm，暴露约 2,000 个文件、512,000 行源代码、44 个未公开功能标志，以及一个名为 KAIROS 的自主后台 Agent。这是 13 个月内第二次泄露，发生在另一次信息外泄后仅 5 天。

角色融合：工程师、PM、设计师的界限在消失

PM 写代码，工程师做产品决策，设计师提交 PR。Anthropic 选的路是大量招有产品品味的工程师——很多工程师能独立完成从看到 Twitter 反馈到周末发布的全流程，几乎不需要 PM 参与。

当代码变得越来越便宜，真正变得更有价值的是决定写什么。什么是正确的 UX？什么是让用户最愉悦的体验方式？

— Cat Wu

Product taste 仍然是一种非常稀缺的技能，任何能强有力地展示这种能力的人，我们基本都会录用。

— Cat Wu

最难的技能：恰好正确程度的 AGI 信仰

每个人都能看到终极未来：模型极其聪明，一个输入框搞定一切。但为那个终极版本做产品太容易了。难的是搞清楚当前模型的能力边界在哪，怎么在边界内榨出最大价值。

做到恰好正确程度的 AGI 信仰非常难。太 AGI pilled 会让你忽略眼前用户的痛点，太保守又会在下一次模型升级时措手不及。

— Cat Wu

Cat 的做法：花 30% 时间故意把产品推到极限，搞清楚模型为什么在某些任务上犯错。培养方式：大量使用模型并让它自省、找到 5 个信任的 taste evaluator、写 10 个好 eval。

模型升级 = 删功能：你的 harness 终会被吃掉

很多产品功能是模型的「拐杖」。早期 Claude Code 做大规模重构时会遗漏 call sites，团队加了 TODO list 强制模型逐一完成。Opus 4 之后模型自然使用 TODO list，不再需要提醒。每次新模型发布，团队通读整个 system prompt：「模型还需要这个提醒吗？」

我们做的很多修改，是删掉不再需要的功能。给产品加功能，本质上是给模型加拐杖。

— Cat Wu

更激进的策略：提前构建当前还不完全 work 的产品，等模型追上来。Code Review 试了好几代模型，直到 Opus 4.5/4.6 才达到可靠水平。

产品路线：从单任务到 50-100 个并发 Agent

核心构建单元是单个任务的成功率。模型变强 → 单任务成功率上升 → 多任务并行 → 50-100 个 Agent 同时工作。这条路线从单兵作战走向 Agent 矩阵。

关键挑战：如何让用户知道哪些任务需要关注？如何确保 agent 自我验证？这已经不是本地机器能承载的了。

自动化 95% = 没有自动化

找到重复性工作交给 AI，但必须推到 100% 可靠。大多数人到 90-95% 就放弃了，而 95% 可靠的自动化你根本不敢依赖。

如果一个自动化不能 100% 可靠地工作，它就不是自动化。最后 5-10% 确实更费时间，但我鼓励大家投入精力去教会 Claude 你的偏好。

— Cat Wu

另一个反直觉建议：别做「设置狂魔」。有些人花太多时间添加 skills 和 MCP，反而忘了核心目标——发布产品。构建你每天真正使用的应用，不是一次性原型。

"Just Do Things" — Jobs are fake

Just do things. 我觉得工作是假的。如果你理解约束条件，就能推导出该做什么，然后快速执行、从错误中学习。做错了就道歉、修正。

— Cat Wu

Cat 认为每个人都应该在某个时候加入初创公司——没有流程的环境会迫使你学会这种思维方式。