百度指伐謀Agent 2.0奪全球第一高難度任務領先同類Agent

商業創科

更新時間：19:20 2026-04-10 HKT
發佈時間：19:20 2026-04-10 HKT

百度智能雲旗下企業級算法優化智能體「百度伐謀Agent 2.0」，近日再次登頂機器學習工程基準測試MLE-Bench，刷新最佳成績（SOTA）。百度稱，該產品將於今年5月Create 2026百度AI開發者大會上正式發布。

MLE-Bench由OpenAI設立，包含75個源自Kaggle競賽的真實工程問題，測試AI在模型訓練、數據準備、實驗運行等全流程的端到端能力。去年10月，伐謀首次登頂該榜單。

高難度任務勝率領先演化策略與長程記憶升級

最新評測顯示，在統一運行標準下，百度伐謀2.0在「高難度」任務上的綜合勝率顯著領先，超越了搭載Claude-Opus-4.6等主流大模型的同類智能體。

百度表示，伐謀2.0在演化策略、長程記憶機制及底層基礎設施方面進行了升級，包括增強演化策略支持智能體多路徑並行探索及回溯調整，以及長程記憶機制協助維持長鏈條任務的邏輯一致性。百度表示，依託全棧AI雲基礎設施，算法演化叠代效率明顯提升。此外，無算法背景的業務人員可用自然語言及數據文件發起需求，系統自動輸出可解釋、可交互的決策方案。

覆蓋汽車、金融、能源等領域科研場景助力航天與災害預測

百度稱，百度伐謀上線至今已吸引數千家企業使用，覆蓋零售、金融、製造、能源、交通等核心領域。汽車製造方面，阿爾特太乙與伐謀合作研發御風智能預測系統，將單次風阻驗證時間從10小時壓縮至數分鐘，整車研發周期平均縮短25%。金融風控方面，中信百信銀行引入伐謀7×24小時挖掘風險特徵，效率提升100%，風控模型風險區分度提升2.41%。能源基建方面，中國能建廣東院用伐謀解決海上風電電纜橋架佈置難題，節省近一周工期。交通信控方面，鄂爾多斯伊金霍洛旗引入伐謀信控平台後，車均延誤降低18%，高峰通行用時降低50%以上。

北京工業大學團隊將伐謀引入中國空間站微型氣相色譜柱設計實驗，大幅提升分離效率；天津大學團隊用於災害預測模型選優，將原本以「周」為單位的科研探索壓縮至6小時內出成果。百度智能雲近期還開源了Famou for Science項目，基於多智能體協同模式構建虛擬科研團隊，支持長線科研任務自動化推進。

即睇《亂世投資》專頁↓