阿里推Qwen3升级版性能超过Kimi-K2及DeepSeek-V3等

更新时间：10:11 2025-07-22 HKT
发布时间：10:11 2025-07-22 HKT

阿里巴巴（9988）旗下通义千问表示，推出Qwen3升级版模型「Qwen3-235B-A22B-Instruct-2507-FP8」，亦是非思考模式（Non-thinking）的更新版本。目前已在魔搭社区和HuggingFace上开源更新。

通用能力显著提升

根据介绍，新Qwen3模型的通用能力显著提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面，在GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）及BFCL（Agent能力）等众多测评中表现出色，超过Kimi-K2、DeepSeek-V3等顶级开源模型，以及Claude-Opus4-Non-thinking等领先闭源模型。

此外，该模型还增强了部份关键性能，包括在多语言的长尾知识覆盖方面，模型取得显著进步；在主观及开放性任务中，模型显著增强了对用户偏好的契合能力，能够提供更有用的回复，生成更高质量的文本；以及长文本提升到256K，上下文理解能力进一步增强。

即睇《乱世投资》专页↓