OpenAI 内部玩法曝光:百万行代码系统,零人工编码与审核
日期:2026-04-14 16:27:48 / 人气:16

OpenAI 也把工程师经验“蒸馏”进skill 了,Harness 爆文作者曝内部玩法:一个百万行代码系统,全程零人工编码和审核。最近,OpenAI的Ryan Lopopolo前不久发了一篇很长的文章《Harness engineering》,成为圈子里的热门话题。在那篇文章里,Ryan第一次比较系统地揭开了OpenAI新近成立的Frontier团队究竟是如何工作的:这个团队如今已经成了OpenAI内部对Codex使用最重度的团队。他们维护着一个代码量超过一百万行的代码库,而且整套系统里,没有一行代码是人工手写的。更关键的是,在代码合并之前,也没有人工参与代码审查。
Ryan对这套方法几乎可以说抱有一种传教士般的热情。他甚至直言,如果你现在每天还不用超过十亿tokens,那几乎都快算得上“失职”了。按照当前市场价格和缓存假设来估算,这大概意味着每天要花掉两三千美元的token成本。
在过去几个月里,他们做了一场非常极端的实验:从零开始构建并交付一个内部测试产品,整个过程里,没有任何一行代码是人工写出来的。在这个实验中,他们逐渐形成了一种完全不同的工程工作方式:当agent失败时,团队不再想着“换个提示词试试”,或者让它“再努力一点”,而是反过来追问:到底缺的是哪一种能力、哪一类上下文,或者哪一层结构?
这个实验最终产出了Symphony。它被Ryan形容为一个“幽灵库”(ghost library),同时也是一个参考性的Elixir实现,由Alex Kotliarskyi完成。它的作用,是搭起一整套庞大的Codex agent系统。每个agent都会被喂入极其细致的提示信息,精细程度接近一份真正的产品需求文档,但又不会直接给出完整实现。
于是,未来的轮廓开始变得越来越清晰:coding agent不再只是坐在你旁边的副驾驶(copilot),而是在逐渐变成任何人都可以真正调用的“队友”。而Codex也在沿着这条方向持续加码,甚至在对外发出了强势信息:你只需要直接开始构建就行。
Ryan一直在推动一件事:如果你不再围绕人的使用习惯来优化代码库、工作流和组织,而是转向围绕agent的可读性来优化,最后会发生什么?在参与Latent Space和AI Engineer的播客期间,他详细分享了Harness Engineering这个概念最初是怎么来的,以及推动整场实验启动的那个核心约束:Ryan一开始就刻意不自己写代码,逼着agent必须从头到尾把事情做完。此外,他还透露了OpenAI内部团队到底是怎么使用Codex的;为什么在AI原生软件开发里,真正的瓶颈变成了人的注意力;他们为什么会如此痴迷于构建速度:为什么“一分钟”被设定成内部循环(inner loop)的上限,以及团队如何一遍遍重做构建系统,只为保证agent能始终保持高效产出等。以下是对原对话的翻译和整理,并在不改变原意基础上进行了部分删减,以飨读者。
有无限的token,“零人工写码”做产品
swyx:你最近写了一篇关于harness engineering的重磅文章,它很可能会成为这个新兴方向最有代表性的一篇文章。
Ryan Lopopolo:谢谢。我觉得这件事挺有意思的,好像我们某种程度上真的先把这场讨论的框架立起来了。
swyx:这应该是你第一次上播客。那先说说,你现在在哪个团队?做的又是什么?
Ryan Lopopolo:可以。我现在在Frontier Product Exploration团队,做的是OpenAI Frontier这条线上的新产品开发。OpenAI Frontier本质上是我们的企业平台,目标是让企业可以以大规模、可治理而且安全的方式部署agent。我们这个团队的职责,就是去探索一些新的方法,看看怎么把模型包装成企业真正愿意买单的产品和解决方案。
swyx:我顺带把你的背景也补充一下。你之前在Snowflake、Brex、Stripe、Citadel待过。
Ryan Lopopolo:对,基本上这辈子都在服务企业客户。
作者:杏宇娱乐
新闻资讯 News
- 宁王:无可撼动的能源时代“台积...04-19
- 3月社零点评:消费倒春寒?问题有...04-19
- 迅策涨了4倍,中科闻歌也来了,同...04-19
- 迅策涨了4倍,中科闻歌也来了,同...04-19

