百度指伐谋Agent 2.0夺全球第一 高难度任务领先同类Agent

更新时间:19:20 2026-04-10 HKT
发布时间:19:20 2026-04-10 HKT

百度智能云旗下企业级算法优化智能体「百度伐谋Agent 2.0」,近日再次登顶机器学习工程基准测试MLE-Bench,刷新最佳成绩(SOTA)。百度称,该产品将于今年5月Create 2026百度AI开发者大会上正式发布。

MLE-Bench由OpenAI设立,包含75个源自Kaggle竞赛的真实工程问题,测试AI在模型训练、数据准备、实验运行等全流程的端到端能力。去年10月,伐谋首次登顶该榜单。

高难度任务胜率领先 演化策略与长程记忆升级

最新评测显示,在统一运行标准下,百度伐谋2.0在「高难度」任务上的综合胜率显著领先,超越了搭载Claude-Opus-4.6等主流大模型的同类智能体。

百度表示,伐谋2.0在演化策略、长程记忆机制及底层基础设施方面进行了升级,包括增强演化策略支持智能体多路径并行探索及回溯调整,以及长程记忆机制协助维持长链条任务的逻辑一致性。百度表示,依托全栈AI云基础设施,算法演化叠代效率明显提升。此外,无算法背景的业务人员可用自然语言及数据文件发起需求,系统自动输出可解释、可交互的决策方案。

覆盖汽车、金融、能源等领域 科研场景助力航天与灾害预测

百度称,百度伐谋上线至今已吸引数千家企业使用,覆盖零售、金融、制造、能源、交通等核心领域。汽车制造方面,阿尔特太乙与伐谋合作研发御风智能预测系统,将单次风阻验证时间从10小时压缩至数分钟,整车研发周期平均缩短25%。金融风控方面,中信百信银行引入伐谋7×24小时挖掘风险特征,效率提升100%,风控模型风险区分度提升2.41%。能源基建方面,中国能建广东院用伐谋解决海上风电电缆桥架布置难题,节省近一周工期。交通信控方面,鄂尔多斯伊金霍洛旗引入伐谋信控平台后,车均延误降低18%,高峰通行用时降低50%以上。

北京工业大学团队将伐谋引入中国空间站微型气相色谱柱设计实验,大幅提升分离效率;天津大学团队用于灾害预测模型选优,将原本以「周」为单位的科研探索压缩至6小时内出成果。百度智能云近期还开源了Famou for Science项目,基于多智能体协同模式构建虚拟科研团队,支持长线科研任务自动化推进。