OpenAI 内部玩法曝光：百万行代码系统，零人工编码与审核

日期：2026-04-14 16:27:48 / 人气：38

OpenAI 也把工程师经验“蒸馏”进skill 了，Harness 爆文作者曝内部玩法：一个百万行代码系统，全程零人工编码和审核。最近，OpenAI的Ryan Lopopolo前不久发了一篇很长的文章《Harness engineering》，成为圈子里的热门话题。在那篇文章里，Ryan第一次比较系统地揭开了OpenAI新近成立的Frontier团队究竟是如何工作的：这个团队如今已经成了OpenAI内部对Codex使用最重度的团队。他们维护着一个代码量超过一百万行的代码库，而且整套系统里，没有一行代码是人工手写的。更关键的是，在代码合并之前，也没有人工参与代码审查。
Ryan对这套方法几乎可以说抱有一种传教士般的热情。他甚至直言，如果你现在每天还不用超过十亿tokens，那几乎都快算得上“失职”了。按照当前市场价格和缓存假设来估算，这大概意味着每天要花掉两三千美元的token成本。
在过去几个月里，他们做了一场非常极端的实验：从零开始构建并交付一个内部测试产品，整个过程里，没有任何一行代码是人工写出来的。在这个实验中，他们逐渐形成了一种完全不同的工程工作方式：当agent失败时，团队不再想着“换个提示词试试”，或者让它“再努力一点”，而是反过来追问：到底缺的是哪一种能力、哪一类上下文，或者哪一层结构？
这个实验最终产出了Symphony。它被Ryan形容为一个“幽灵库”（ghost library），同时也是一个参考性的Elixir实现，由Alex Kotliarskyi完成。它的作用，是搭起一整套庞大的Codex agent系统。每个agent都会被喂入极其细致的提示信息，精细程度接近一份真正的产品需求文档，但又不会直接给出完整实现。
于是，未来的轮廓开始变得越来越清晰：coding agent不再只是坐在你旁边的副驾驶（copilot），而是在逐渐变成任何人都可以真正调用的“队友”。而Codex也在沿着这条方向持续加码，甚至在对外发出了强势信息：你只需要直接开始构建就行。
Ryan一直在推动一件事：如果你不再围绕人的使用习惯来优化代码库、工作流和组织，而是转向围绕agent的可读性来优化，最后会发生什么？在参与Latent Space和AI Engineer的播客期间，他详细分享了Harness Engineering这个概念最初是怎么来的，以及推动整场实验启动的那个核心约束：Ryan一开始就刻意不自己写代码，逼着agent必须从头到尾把事情做完。此外，他还透露了OpenAI内部团队到底是怎么使用Codex的；为什么在AI原生软件开发里，真正的瓶颈变成了人的注意力；他们为什么会如此痴迷于构建速度：为什么“一分钟”被设定成内部循环（inner loop）的上限，以及团队如何一遍遍重做构建系统，只为保证agent能始终保持高效产出等。以下是对原对话的翻译和整理，并在不改变原意基础上进行了部分删减，以飨读者。
有无限的token，“零人工写码”做产品
swyx：你最近写了一篇关于harness engineering的重磅文章，它很可能会成为这个新兴方向最有代表性的一篇文章。
Ryan Lopopolo：谢谢。我觉得这件事挺有意思的，好像我们某种程度上真的先把这场讨论的框架立起来了。
swyx：这应该是你第一次上播客。那先说说，你现在在哪个团队？做的又是什么？
Ryan Lopopolo：可以。我现在在Frontier Product Exploration团队，做的是OpenAI Frontier这条线上的新产品开发。OpenAI Frontier本质上是我们的企业平台，目标是让企业可以以大规模、可治理而且安全的方式部署agent。我们这个团队的职责，就是去探索一些新的方法，看看怎么把模型包装成企业真正愿意买单的产品和解决方案。
swyx：我顺带把你的背景也补充一下。你之前在Snowflake、Brex、Stripe、Citadel待过。
Ryan Lopopolo：对，基本上这辈子都在服务企业客户。

作者：杏宇娱乐

OpenAI 内部玩法曝光：百万行代码系统，零人工编码与审核

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →