
新智元报说念德州设备保温施工队
剪辑:好困 KingZH
【新智元读】澳洲牧羊大叔顺手写的三行bash,11天内被OpenAI、Anthropic和Hermes集体收编了。
醒觉来,Claude Code又新!
为了让Claude 执续责任直到任务完成,Claude Code近出的新:/goal 。
你独一设定条目,Claude不完成任务它不驱散!
用过AI编程器具的东说念主齐懂,这到底多蹙迫!
你给Agent下了个任务,它跑了三个回,改了两个文献,倏得停驻来问你「接下来需要我作念什么?」
不是,bug你这还没修完呢啊!
Agent越来越灵敏,写代码越来越快,但「从新到尾把件事干完」这件事,到2026岁首齐莫得能作念到。
然后,位来自澳大利亚的牧羊大叔Geoffrey Huntley,用三行bash惩处了。
done
他把它定名为Ralph Loop,问候《辛普森》里阿谁始终搞不清景色但从不烧毁的小孩Ralph Wiggum。
逻辑其热烈,限轮回,反复把同个prompt喂给Agent。程度写在文献系统和Git历史里,险峻文满了就开新实例,读文献接着干。
原始,瞻念,但特别有。
有到OpenAI看见了,Nous Research看见了,Anthropic也看见了。
11天,三顶AI实验室,殊途同归地把这三行bash写进了官产物。
这刻,扫数东说念主齐表露了件事——
通用东说念主工智能的临门脚,可能不是灵敏的模子,而是「把事作念完」的模子。
换句话说,AI编程的中枢战场正在从「生成代码」转向「闭环拜托」。
11天,三条线,同个特别
4月30日,OpenAI的Codex最初上线/goal。
Greg Brockman在X上只丢了句,「Codex现已内置Ralph loop++」。
周后,Hermes Agent跟上。又过4天,Claude Code也上了。
11天。三。同个敕令。同个。
但完毕旅途,差了十万八沉。
Codex「不忘事」德州设备保温施工队,Hermes「不烂尾」,Claude Code「不自欺」。
Codex:
把观点存成条数据库纪录
OpenAI是三里先起始的,案也纯粹。
在Codex里,/goal是个执久化的责任流对象,存在土产货的app-server状态层里。
关掉末端、上条记本、甚而重启系统,观点齐不会丢。下次开Codex,自动接上。
模子通过结构化的update_goal器具陈述程度状态,token预算破费时触发「软着陆」而非硬停。
有东说念主用这个贯穿跑了14个小时,中间暂停5小时去寝息,追忆Codex从断点续跑,把个辅导驱动名堂作念收场。
工程化,干净,但克制。
Hermes Agent:
个东说念骨干不完,那就上个团队
Hermes Agent的权术大。
在这里,/goal仅仅冰山角。真确的重头戏是多智能体看板系统,Hermes把「让AI把活干完」从单Agent问题升成了团队合作问题。
看板的底层是土产货SQLite,铁皮保温施工执久化存储,跨重启不丢。
你在上头创建个任务卡片,Hermes会径直把它拆成多个子任务,分拨给不同的Agent worker。每个worker是个立的OS经过,有我方的身份、模子建树和责任目次。
看板和/goal是两套互补的系统。/goal管的是单个Agent的观点锁定(Ralph loop),看板管的是多个Agent之间的任务更变。个纵向入,个横向铺开。
后,是五层烂尾机制。
层,心跳检测。每个worker按时向看板报到,讲授我方还谢世。
二层,僵尸回收。worker时没反应?系统自动判定示寂,回收它手上的任务再行分拨。macOS上还有门的达尔文僵尸检测逻辑。
三层,退出阻难。worker没完成任务就退出了?系统自动把它标记为blocked,不让它再接新活,止「摸鱼型Agent」反复任务又不作念。
四层,幻觉阻难。这是狠的层。AI说「我作念收场」不算数,系统会考据它执行产出的代码是否真实落盘了。Agent说我方创建了个文献但执行上莫得?收拢,回滚,重来。
手机:18632699551(微信同号)五层,重试预算。每个任务有立的max_retries,多重试N次,过就上报东说念主类。对不会限轮回到死机。
Claude Code:
作念事的东说念主和验收的东说念主,不行是同个
Anthropic是三里后起始的,但案玄妙。
实质上,Claude Code的/goal是个session别的Stop Hook。
你设定个完成条目(比如「test/auth目次下扫数测试通过且lint报错」),Claude就运行干活。
纰谬策画在验收次序。每干完轮,系统不让Claude我方判断「我作念收场莫得」。
它把对话纪录和你的完成条目起发给个立的小模子(默许是Haiku),让这个小模子来裁判。
小模子要是以为没完成,就需要复返个具体原理(比如「test_login.py还有2个failure」)。然后这个原理解被注入Claude下轮的险峻文,指它接着干。
要是小模子认为完成了,观点就会自动打消,任务扫尾。
值得提的是,这个裁判模子不调用任何器具,不读文献,不跑敕令。它只看Claude在对话里产出的内容。
是以,你的完成条目须是Claude在对话中能讲授的东西。
它长维持4000字符,因此你不错写得很细。
甚而,还不错在条目里加拘谨,比如「不修改其他测试文献」「20轮内完成不然罢手」等等。
决赛进行时:责任流进口
把视角拉远步。
Claude Code背后站着Anthropic,Codex背后站着OpenAI,Hermes Agent接入了双方的模子,同期亦然DeepSeek V4等模子的主力分发渠说念。
三条旅途,碰巧掩饰了ASI决赛的三个生态进口。
而他们争的,亦然不异东西——责任流。
谁的Agent先闪开荒者养成「设完观点就走开」的民风,谁就锁死了责任流进口。
因为民风旦酿成,迁徙资本是指数的。
你不会应酬离开个也曾跑通了看板更变、断点续传、checkpoint回滚的Agent基础次序。
个看似很小的/goal敕令,背后卡的是整条Agent责任流的护城河。
参考贵寓:
https://code.claude.com/docs/en/goal
https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7
https://github.com/anthropics/claude-code/releases/tag/v2.1.139
https://developers.openai.com/codex/changelog
相关词条:离心玻璃棉 塑料挤出机 钢绞线厂家 铝皮保温 pvc管道管件胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。


