百度指伐谋Agent 2.0夺全球第一高难度任务领先同类Agent

商业创科

更新时间：19:20 2026-04-10 HKT
发布时间：19:20 2026-04-10 HKT

百度智能云旗下企业级算法优化智能体「百度伐谋Agent 2.0」，近日再次登顶机器学习工程基准测试MLE-Bench，刷新最佳成绩（SOTA）。百度称，该产品将于今年5月Create 2026百度AI开发者大会上正式发布。

MLE-Bench由OpenAI设立，包含75个源自Kaggle竞赛的真实工程问题，测试AI在模型训练、数据准备、实验运行等全流程的端到端能力。去年10月，伐谋首次登顶该榜单。

高难度任务胜率领先演化策略与长程记忆升级

最新评测显示，在统一运行标准下，百度伐谋2.0在「高难度」任务上的综合胜率显著领先，超越了搭载Claude-Opus-4.6等主流大模型的同类智能体。

百度表示，伐谋2.0在演化策略、长程记忆机制及底层基础设施方面进行了升级，包括增强演化策略支持智能体多路径并行探索及回溯调整，以及长程记忆机制协助维持长链条任务的逻辑一致性。百度表示，依托全栈AI云基础设施，算法演化叠代效率明显提升。此外，无算法背景的业务人员可用自然语言及数据文件发起需求，系统自动输出可解释、可交互的决策方案。

覆盖汽车、金融、能源等领域科研场景助力航天与灾害预测

百度称，百度伐谋上线至今已吸引数千家企业使用，覆盖零售、金融、制造、能源、交通等核心领域。汽车制造方面，阿尔特太乙与伐谋合作研发御风智能预测系统，将单次风阻验证时间从10小时压缩至数分钟，整车研发周期平均缩短25%。金融风控方面，中信百信银行引入伐谋7×24小时挖掘风险特征，效率提升100%，风控模型风险区分度提升2.41%。能源基建方面，中国能建广东院用伐谋解决海上风电电缆桥架布置难题，节省近一周工期。交通信控方面，鄂尔多斯伊金霍洛旗引入伐谋信控平台后，车均延误降低18%，高峰通行用时降低50%以上。

北京工业大学团队将伐谋引入中国空间站微型气相色谱柱设计实验，大幅提升分离效率；天津大学团队用于灾害预测模型选优，将原本以「周」为单位的科研探索压缩至6小时内出成果。百度智能云近期还开源了Famou for Science项目，基于多智能体协同模式构建虚拟科研团队，支持长线科研任务自动化推进。

即睇《乱世投资》专页↓