百度指伐謀Agent 2.0奪全球第一 高難度任務領先同類Agent

更新時間:19:20 2026-04-10 HKT
發佈時間:19:20 2026-04-10 HKT

百度智能雲旗下企業級算法優化智能體「百度伐謀Agent 2.0」,近日再次登頂機器學習工程基準測試MLE-Bench,刷新最佳成績(SOTA)。百度稱,該產品將於今年5月Create 2026百度AI開發者大會上正式發布。

MLE-Bench由OpenAI設立,包含75個源自Kaggle競賽的真實工程問題,測試AI在模型訓練、數據準備、實驗運行等全流程的端到端能力。去年10月,伐謀首次登頂該榜單。

高難度任務勝率領先 演化策略與長程記憶升級

最新評測顯示,在統一運行標準下,百度伐謀2.0在「高難度」任務上的綜合勝率顯著領先,超越了搭載Claude-Opus-4.6等主流大模型的同類智能體。

百度表示,伐謀2.0在演化策略、長程記憶機制及底層基礎設施方面進行了升級,包括增強演化策略支持智能體多路徑並行探索及回溯調整,以及長程記憶機制協助維持長鏈條任務的邏輯一致性。百度表示,依託全棧AI雲基礎設施,算法演化叠代效率明顯提升。此外,無算法背景的業務人員可用自然語言及數據文件發起需求,系統自動輸出可解釋、可交互的決策方案。

覆蓋汽車、金融、能源等領域 科研場景助力航天與災害預測

百度稱,百度伐謀上線至今已吸引數千家企業使用,覆蓋零售、金融、製造、能源、交通等核心領域。汽車製造方面,阿爾特太乙與伐謀合作研發御風智能預測系統,將單次風阻驗證時間從10小時壓縮至數分鐘,整車研發周期平均縮短25%。金融風控方面,中信百信銀行引入伐謀7×24小時挖掘風險特徵,效率提升100%,風控模型風險區分度提升2.41%。能源基建方面,中國能建廣東院用伐謀解決海上風電電纜橋架佈置難題,節省近一周工期。交通信控方面,鄂爾多斯伊金霍洛旗引入伐謀信控平台後,車均延誤降低18%,高峰通行用時降低50%以上。

北京工業大學團隊將伐謀引入中國空間站微型氣相色譜柱設計實驗,大幅提升分離效率;天津大學團隊用於災害預測模型選優,將原本以「周」為單位的科研探索壓縮至6小時內出成果。百度智能雲近期還開源了Famou for Science項目,基於多智能體協同模式構建虛擬科研團隊,支持長線科研任務自動化推進。