百度DuMate膺全球智能體評測榜首 超越OpenAI及Anthropic
更新時間:18:23 2026-05-08 HKT
發佈時間:18:23 2026-05-08 HKT
發佈時間:18:23 2026-05-08 HKT
百度(9888)旗下智能體產品DuMate今日在國際評測基準PinchBench中奪得榜首,並在前五位中佔據三席,成績超越Anthropic與OpenAI。在另一項DeepResearch深度研究榜單中,DuMate同樣位列第一。
評測三維度領先對手
PinchBench為OpenClaw賽道公認最能反映智能體真實工作能力的評測基準,涵蓋23個真實工作場景共147個任務,從成功率、速度及成本三個維度綜合排名。結果顯示,DuMate以93.3%及93.2%的總成績包攬前兩名,而Anthropic及OpenAI同類模型在同一場景下的成績分別為89.0%及91.6%。百度方面表示,同一模型在DuMate框架下展現出更強執行力。
百度:端雲協同架構成功降本增效
百度表示,DuMate的技術優勢在於其端雲協同架構,其中涉及私隱的操作在本地完成,複雜推理則上雲處理,無需用戶手動切換。該架構有效平衡了數據安全與運算效率,同時按需調用上下文,降低冗餘運算成本。百度稱,此設計使不同底層模型均能穩定發揮接近其性能上限的水平,實現成本與速度的優化。
在DeepResearch Bench榜單中,DuMate以58.03綜合分位列第一。其自研雙引擎分別負責跨平台檢索及多輪推理分析,將碎片信息轉化為結構化研究成果。
自2026年3月上線以來,DuMate保持一日一版更新節奏,已通過中國信通院兩項安全測評並獲最高等級。
最Hit

















