阿里旗下通义千问推能力最强模型「Qwen3-Max」

更新时间:11:44 2025-09-24 HKT
发布时间:11:44 2025-09-24 HKT

据内媒引述阿里云通义千问指出,继Qwen3-2507系列后,再推出迄今为止规模最大、能力最强的模型「Qwen3-Max」。

多项测试中达业界领先水平

目前Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat;正式版本在代码能力和智能体(agent)能力方面亦进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中,均达到业界领先水平。

通义团队表示,Qwen3-Max模型总参数超过1T,预训练使用了36T tokens,模型结构沿用了Qwen3系列的模型结构设计范式,使用了通义提出的global-batch load balancing loss。

此外,仍在训练中的Qwen3-Max-Thinking已展现出非凡潜力,在结合工具使用并增加测试时计算资源的情况下,该思考版本已在AIME 25、HMMT等高难度推理基准测试中取得100%的准确率,期待不久将来可向公众正式发布新版本。