
【新智元导读】从写指示,到给指标,再到只给一句意图:有东说念骨干脆让Codex我方定任务——东说念主类还能留在编程的打算层吗?
「我基本上再也不我方写/goal了。」
近日,前Anthropic成员、现MagicPath CEO的Pietro Schirano在X上甩出这句话,挑剔区一会儿炸开。

他的作念法是:不再手写那份/goal,而是让Codex为我方写一份,再为它派生的每个子智能体(agent)各写一份。
把一个高层意图丢给Codex,让它先给我方写一份详备的/goal——何如拆任务、哪些并行、终末何如汇总,全由模子我方定。
从新到尾,东说念主类只用在最驱动说出我方的意图,剩下的拆解、诊治、终局,模子我方都能安排得清雪白白。
别小看Pietro这句话,此次他交给AI的并非是膂力,而是判断力:往日开发者交给AI的是「何如写」,这一次交出去的是「写什么」。
先是写一句辅导词,AI把活干了。
自后连辅导词都懒得细写,只丢一句朦胧的指标,剩下何如作念、分几步,让它我方计划。
到咫尺,索性连「指标」都不写了。
挑剔区一位网友惊奇说念:
咱们大略一经参加这么一个期间:我给AI一个指标,AI把这个指标改得更好,然后我限定地假装我方一直是阿谁样貌司理。
这句话刚好戳中了此次变迁的中枢。
当一个要道员连「要干什么」都不再亲手写,他在这条活水线上,到底还剩下什么?

东说念主只管给意图
任务交给agent去念念
往日几年,辅导词工程被捧成AI期间的硬妙技。会写辅导词,就好比抓住了独霸模子的缺陷。
再往后是元辅导(meta-prompting):你不屈直写指示,而是让模子帮你把指示写得更好。
而此次Codex所演示的更进一步:自生成指标(self-goal generation)。模子并非把你的话润色成更漂亮的指示,它平直袭取了「指标」自身:你给意图,它写/goal。
这套玩法的底座,是Codex本年4月底上线的/goal功能,先在Codex CLI里出现,近期在config.toml里把features.goals掀开就能用。
官方把它塞进Codex CLI的0.128.0版块,默许关闭,要手动改树立文献才能掀开。
开发者圈给它起了个花名,叫「Ralph轮回」:计算、践诺、测试、复查、迭代,一齐自转,不到指标不收手。
它与鄙俚对话辅导词最大的不同,是goal这段笔墨会同期充任两样东西:肇端指示,和「完成审计」。
Codex每跑完一轮,就回头对照指标问我方两句:还该作念什么,是不是一经作念结束。一轮接一轮,直到任务完成、被你叫停,或者token烧到上限。
是以官方反复强调一件事:指标一定要写到Codex能判断「作念完莫得」,要幸免「优化一下」「完善一下」这种虚词。
真的给这件事定调的,开云体育中国官网在线入口是OpenAI的Codex负责东说念主Tibo(Thibault Sottiaux)。

他在X上说,咱们造的每一个器用,都同期是给智能体用的:
Codex能检察、也能设立我方的/goal。这是元辅导的泛化,用一句话抽象即是:东说念主给意图,智能体来生成任务。
开发者@MikelEcheve把这套才气进一步讲明为:Codex能自建/goal、为并行的智能体生成指标、自主切单干作。

Codex自述:「因为你明确要并行智能体,我就用多智能体器用」,并已「Created an agent」,右侧子智能体面板出现首个分身Gibbs。图源:Pietro Schirano @skirano演示视频

有东说念主一经用它干了18个小时
/goal的自转才气,一经有东说念主拿真实样貌考证过。
有开发者实测:给Codex一句高层指标,把BACKLOG.md里的18个功能全部拜托,然后东说念主就离开了。
约18小时后回归,Codex一经自主完毕其中14个,每一处改革都过了测试、在CI里合并,全程没要一次东说念主工点头,连代码自审都交给了GPT子智能体。
算下来,这趟跑了约4.20好意思元。
skirano展示的,是更上头那一层:不单让Codex践诺一份goal,而是让它给我方和每个子智能体各写一份goal,智能体的层级自动就长了出来。
只丢给它一句话,Codex就把该干全干了。

运行约10秒,景象变为「Creating 2 agents」,右侧子智能体已推广为Gibbs与Leibniz两个并行分身。图源:Pietro Schirano @skirano演示视频

主智能体「Created 3 agents」,2026年世界杯官网右窗子智能体Gibbs正在践诺我方的专属/goal:联想一条数学化的过山车轨说念。各自一份goal,恰是这套布置的中枢。图源:Pietro Schirano @skirano演示视频
这套布置正在被模板化。
开发者Pablo Stanley把它作念成了模板,给出一套「Build [THING]+功能+立场」的辅导词框架,让Codex照着自动生成goal、再孵化对应的子智能体。整套历程,东说念主只负责起首那句话。这个模板被skirano本东说念主点赞。
在Reddit的r/codex社区,开发者一经用/goal作念遥远任务对都、自动生成验收程序、隐蔽死轮回。
另一位开发者RTK(@riverkhan)走得更远。OpenAI团队前不久发了一篇讲何如把/goal用好的著述,他平直把内部的最好实践封装成开源skill,取名Infinite Skills,仿照Superpowers的结构,每个skill即是skills目次下扁平的一份SKILL.md。
里头阿谁叫goal的skill,干的事很有敬爱:在你正经发起/goal之前,它先反过来「口试」你,把一个无极的指标,一句句询查成具体、可考证的公约,再把整理好的完竣指标喂给goal样子。

https://github.com/Infinite-Labs-AI/infinite-skills
换句话说,goal样子跑得好不好,本就取决于指标写得够不够具体、能不可让Codex我方判断作念完莫得。
如今连「把指标询查明晰」这一步,都有东说念主作念成器用替你包办了。

三家把吞并件事作念了
这股潮水并非Codex独自引颈。
险些在吞并个手艺窗口里,三家主流编程智能体,把「让AI我方拆任务、我方派智能体」这项功能,不谋而合地推了出来。
Anthropic的多智能体编排5月6日上线,Cursor的/orchestrate只隔一天、5月7日跟上。
再往前推到4月底,Codex早把/goal这块自治轮回这层基础底细铺好了。
三家险些是前后脚,目的却稀奇一致。
社区里很快有网友把它和Claude Code的CLAUDE.md放在统共比拟:通常是让智能体读一份「写给我方看的阐述」,再据此举止。
因此,它更像一个跨产物的共性目的,而非某一家的独门特色。
有敬爱的是细节上的选定。
Claude的coordinator最多能派20个subagent,况且刻意适度只派一层:深度跳动1,平直忽略。
这和Codex那种铁心并行派生的途径,恰恰是两种心态。
这背后藏着一条更长的线。
当Codex能给我方、给一群子智能体派活,它就不再仅仅一个写代码的助手,而更像一个跑在后台的任务诊治器,写代码仅仅它顺遂颖异的一件事。
OpenAI念念让智能体我方设定任务,盯着的显然是比「帮东说念主写代码」大得多的盘子。

注重token账单爆了
我方写指标、我方派agent,听上去很爽,但代价即是可能刷爆你的token账单。
任务跑得越久、越不需要东说念主盯,token就烧得越凶。
a16z的Andrew Chen,拿/goal在一个真实的eGPU加Mac拓荒驱动样貌上跑了一通宵:不是教化demo,是真干活,14小时往日,第二天早上它还在鼓吹。
Andrew Chen直言,这会让token用量翻一万倍。

你手动提20次、每次盯着看的会话,撑死几十万token;一个跑14小时、没东说念愚弄的会话,量级统统不是一趟事。
就连官方也在教东说念主踩刹车:提倡你在goal末尾加一句token预算,也别一上来就发/goal,先把样貌跑出个雏形再说。

指标会漂
智能体可能偷懒
吵杂归吵杂,社区的权衡里,质疑声并不少:
让AI我方写指标,会不会出现指标漂移,跑着跑着就偏了?
2026世界杯中国线上平台智能体会不会偷懒,专挑省事的近路走?
这套东西,到底进不进得了真的的分娩环境?
Reddit的r/codex里,全球把/goal主要照旧用在长任务对都、生成验收程序、幸免死轮回上:实践上,照旧「东说念主得在独揽盯着」的景象。
网友nick吐槽,再让它递归派生几层,Codex的重要指标,怕是要造成把咱们重构出局。
而Claude阿谁「只派一层」的适度也阐述今天的所谓自治,更像是带着护栏的放权,离一个真的完竣的自治多智能体系统,还有很远的距离。
但真的的迁徙正在发生,东说念主从计算层后移了一步:先是不写代码,后是不写任务,如今只剩下一句话。
当Codex、Cursor、Claude集体把「界说任务」也交还给模子2026年世界杯官网,新的问题是现代码、任务、意图一层层交出去之后,要道员要怎样再行界说我方的扮装。