百度DuMate膺全球智能体评测榜首 超越OpenAI及Anthropic

更新时间:18:23 2026-05-08 HKT
发布时间:18:23 2026-05-08 HKT

百度(9888)旗下智能体产品DuMate今日在国际评测基准PinchBench中夺得榜首,并在前五位中占据三席,成绩超越Anthropic与OpenAI。在另一项DeepResearch深度研究榜单中,DuMate同样位列第一。

评测三维度领先对手

PinchBench为OpenClaw赛道公认最能反映智能体真实工作能力的评测基准,涵盖23个真实工作场景共147个任务,从成功率、速度及成本三个维度综合排名。结果显示,DuMate以93.3%及93.2%的总成绩包揽前两名,而Anthropic及OpenAI同类模型在同一场景下的成绩分别为89.0%及91.6%。百度方面表示,同一模型在DuMate框架下展现出更强执行力。

百度:端云协同架构成功降本增效

百度表示,DuMate的技术优势在于其端云协同架构,其中涉及私隐的操作在本地完成,复杂推理则上云处理,无需用户手动切换。该架构有效平衡了数据安全与运算效率,同时按需调用上下文,降低冗余运算成本。百度称,此设计使不同底层模型均能稳定发挥接近其性能上限的水平,实现成本与速度的优化。

在DeepResearch Bench榜单中,DuMate以58.03综合分位列第一。其自研双引擎分别负责跨平台检索及多轮推理分析,将碎片信息转化为结构化研究成果。

自2026年3月上线以来,DuMate保持一日一版更新节奏,已通过中国信通院两项安全测评并获最高等级。