阿里开源通义千问3.0 大降部署成本 称性能媲美DeepSeek等顶级AI

更新时间:09:56 2025-04-29 HKT
发布时间:09:56 2025-04-29 HKT

阿里巴巴(9988)周一(28日)发布及开源通义千问3.0(Qwen3)系列模型,并称其在数学和编程等方面均可与DeepSeek、ChatGPT-o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型的性能媲美。阿里表示,与其他主流模型相比,该模型还显著降低部署成本,可同时集成两种思考模式,支持119种语言,便于Agent调用。

有效进行自我事实覆查

阿里表示,Qwen3包括两个专家混合(MoE)模型和另外6个模型。同时,该模型是「混合型」模型,既可以花时间「推理」解决复杂问题,也可以快速回答简单请求,分别叫做「思考模式」和「非思考模式」。其中「思考模式」中的推理能力使模型能有效进行自我事实覆查,类似于ChatGPT-o3模型,但推理过程中的延迟时间较高。

首要实现通用人工智能

目前,阿里正以Qwen为核心,构建其AI版图。今年2月,阿里巴巴首席执行官吴泳铭表示,公司目前的「首要目标」是实现通用人工智能(AGI),即打造具备人类智力水平的AI系统。

阿里表示,Qwen3代表公司正在通往通用人工智能(AGI)和超级人工智能(ASI)。未来公司计划从多个维度提升模型,包括优化模型架构和训练方法,以实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围,并利用环境反馈推进强化学习以进行长周期推理。