Anthropic在2025年6月16日發(fā)布的技術(shù)博客中,詳細(xì)披露了其Claude AI多智能體研究系統(tǒng)的構(gòu)建歷程。該系統(tǒng)采用“主導(dǎo)智能體(LeadResearcher)+子智能體(Subagents)”架構(gòu),在處理開(kāi)放性研究任務(wù)時(shí)展現(xiàn)出顯著優(yōu)勢(shì)。內(nèi)部評(píng)測(cè)顯示,以Claude Opus 4為主智能體、Claude Sonnet 4為子智能體的組合,性能較單智能體提升??90.2%??。
??動(dòng)態(tài)并行處理突破單智能體極限??
傳統(tǒng)檢索增強(qiáng)生成(RAG)依賴靜態(tài)檢索,而Anthropic的解決方案通過(guò)多步驟動(dòng)態(tài)搜索實(shí)現(xiàn)突破。主導(dǎo)智能體將用戶查詢拆解為子任務(wù)后,??同時(shí)激活3-5個(gè)子智能體??,每個(gè)子智能體可并行調(diào)用3個(gè)以上工具。這種設(shè)計(jì)使復(fù)雜查詢的研究時(shí)間縮短90%,例如在檢索“信息技術(shù)S&P 500企業(yè)董事會(huì)成員”時(shí),多智能體系統(tǒng)成功完成任務(wù),而單智能體因串行檢索失敗。
核心優(yōu)勢(shì)源于??token的高效利用??。在BrowseComp評(píng)估中,token消耗量單獨(dú)解釋80%的性能差異。升級(jí)至Claude Sonnet 4帶來(lái)的效率提升,甚至超過(guò)將Claude Sonnet 3.7的token預(yù)算翻倍。但代價(jià)是顯著增加的資源消耗——多智能體系統(tǒng)的token使用量達(dá)普通聊天的15倍,單智能體則為4倍。
??提示詞工程解決協(xié)同難題??
早期版本曾出現(xiàn)“為簡(jiǎn)單查詢生成50個(gè)子智能體”的失控情況。Anthropic通過(guò)精細(xì)化提示詞設(shè)計(jì)建立控制機(jī)制:
- ??分級(jí)投入規(guī)則??:簡(jiǎn)單查詢分配1個(gè)智能體(3-10次工具調(diào)用),復(fù)雜任務(wù)啟用10+子智能體
- ??工具選擇啟發(fā)式??:強(qiáng)制智能體先掃描所有可用工具,專業(yè)任務(wù)優(yōu)先選用專用工具
- ??擴(kuò)展思維模式??:讓Claude展示思考過(guò)程,主導(dǎo)智能體借此規(guī)劃策略
“我們?cè)试S主導(dǎo)智能體發(fā)出‘研究芯片短缺’這類模糊指令,結(jié)果三個(gè)子智能體重復(fù)檢索2025年供應(yīng)鏈數(shù)據(jù),報(bào)告重復(fù)率達(dá)60%。”團(tuán)隊(duì)通過(guò)引入??明確的任務(wù)邊界描述??解決了這一問(wèn)題。
??生產(chǎn)環(huán)境挑戰(zhàn)與解決方案??
智能體系統(tǒng)的狀態(tài)持續(xù)性帶來(lái)獨(dú)特工程難題:
- ??錯(cuò)誤累積??:采用檢查點(diǎn)恢復(fù)機(jī)制,結(jié)合Claude的自主調(diào)整能力處理工具故障
- ??調(diào)試?yán)щy??:部署全量生產(chǎn)追蹤系統(tǒng)監(jiān)控決策模式
- ??版本管理??:使用彩虹部署逐步遷移流量,避免中斷運(yùn)行中的智能體
當(dāng)前同步執(zhí)行架構(gòu)存在瓶頸,主導(dǎo)智能體需等待子智能體全部完成。Anthropic透露正在開(kāi)發(fā)異步方案,但需平衡??并行性與錯(cuò)誤傳播風(fēng)險(xiǎn)??。
該技術(shù)已應(yīng)用于實(shí)際場(chǎng)景,用戶反饋稱其能“發(fā)現(xiàn)商業(yè)機(jī)會(huì)”“厘清醫(yī)療方案”。Anthropic強(qiáng)調(diào),成功部署需??研究、產(chǎn)品與工程團(tuán)隊(duì)的深度協(xié)作??,以及對(duì)智能體能力閾值的準(zhǔn)確認(rèn)知。隨著AI進(jìn)入?yún)f(xié)同智能階段,多智能體系統(tǒng)正成為解決開(kāi)放性問(wèn)題的關(guān)鍵基礎(chǔ)設(shè)施。