阿里旗下通义千问推能力最强模型「Qwen3-Max」

更新时间：11:44 2025-09-24 HKT
发布时间：11:44 2025-09-24 HKT

据内媒引述阿里云通义千问指出，继Qwen3-2507系列后，再推出迄今为止规模最大、能力最强的模型「Qwen3-Max」。

多项测试中达业界领先水平

目前Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三，超越了GPT-5-Chat；正式版本在代码能力和智能体（agent）能力方面亦进一步提升，在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中，均达到业界领先水平。

通义团队表示，Qwen3-Max模型总参数超过1T，预训练使用了36T tokens，模型结构沿用了Qwen3系列的模型结构设计范式，使用了通义提出的global-batch load balancing loss。

此外，仍在训练中的Qwen3-Max-Thinking已展现出非凡潜力，在结合工具使用并增加测试时计算资源的情况下，该思考版本已在AIME 25、HMMT等高难度推理基准测试中取得100%的准确率，期待不久将来可向公众正式发布新版本。

即睇《乱世投资》专页↓

最Hit

海外置业

18小时前

影视圈

1小时前

影视圈

13小时前

即时国际

22小时前

饮食

20小时前

影视圈

12小时前

突发

4小时前

即时娱乐

3小时前

时事热话

22小时前

即时中国

4小时前