3月31日,智譜(即北京智譜華章科技有限公司)在中關(guān)村論壇上正式發(fā)布了智能體“AutoGLM沉思”,其具備深度研究能力(Deep Research),同時(shí)實(shí)現(xiàn)實(shí)際操作,推動(dòng)人工智能Agent(智能體)進(jìn)入“邊想邊干”的階段。
對(duì)于Agent層面的探索,公司CEO張鵬在發(fā)言中表示,Agent也存在類似Scaling Law(規(guī)模定律)的特點(diǎn),通過擴(kuò)展訓(xùn)練時(shí)的inference compute(推理計(jì)算),Agent展現(xiàn)出了更強(qiáng)的性能。
張鵬表示,在Agent Scaling Law的基礎(chǔ)上,他們進(jìn)一步發(fā)現(xiàn)了Agent的能力。他舉例稱,在訓(xùn)練過程中,工作人員從未教過AutoGLM沉思訪問巨潮資訊網(wǎng)。然而,當(dāng)發(fā)送指令“幫我收集昨天關(guān)于具身智能的相關(guān)研報(bào)”時(shí),AutoGLM沉思能夠規(guī)劃出通過訪問巨潮資訊網(wǎng)解決問題的方案。
AutoGLM沉思的技術(shù)演進(jìn)路徑為:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型。張鵬表示,其中核心鏈路的模型和技術(shù)將于4月14日正式開源,以此推動(dòng)行業(yè)生態(tài)發(fā)展。
張鵬在發(fā)布會(huì)上表示,基于最新的技術(shù)積累,智譜重新訓(xùn)練了一個(gè)320億參數(shù)的基座模型GLM-4-Air-0414,在其預(yù)訓(xùn)練階段加入了更多的代碼類、推理類數(shù)據(jù),并在對(duì)齊階段針對(duì)智能體能力進(jìn)行了優(yōu)化,該模型在工具調(diào)用、聯(lián)網(wǎng)搜索等智能體任務(wù)上的能力得到大大加強(qiáng)。