DeepSeek低调发布V3新模型 保持开源兼降计算成本 令人质疑矽谷模式

更新时间:15:32 2025-03-25 HKT
发布时间:15:32 2025-03-25 HKT

中国人工智能初创DeepSeek周一低调发布了新模型「DeepSeek-V3-0324」,初步测试显示其可在消费级硬件上运行,打破大模型需要数据中心的传统思路;同时继续降低大模型能耗及计算成本,并保持开源以不断推动技术创新,引领内地AI行业迅速发展,令人对矽谷的封闭付费模式产生质疑。

指标超越Claude Sonnet 3.5

据内媒报道,DeepSeek在没有任何公告的情况下,在AI存储库Hugging Face上线新的DeepSeek-V3模型。

有AI研究员表示,该模型可配备M3 Ultra芯片的苹果电脑上,以每秒20个token的速度运行,意味数据中心并不是大模型的必要搭配。另一研究员亦在X上宣称,在内部工作上测试了新版DeepSeek-V3后,发现它在测试的所有指标上都有了巨大飞跃,更超越了甲骨文的Claude Sonnet 3.5,成为最好的非推理模型。

免费下载和使用令网民兴奋

此外,由于DeepSeek的模型都是开源模型,可供任何人免费下载和使用,与按月收取20美元费用的Claude Sonnet截然相反。另有网民更在社交平台X上表示,这相当于「免费获得法拉利」。

报道又提到,DeepSeek新模型的改变对于业内具有重大意义,一方面大大降低了大模型的能耗及计算成本,进一步动摇了华尔街对于顶级模型基础设施的投资规模假设;另一方面,中国人工智能行业对开源的广泛共识又迅速推动内地AI行业的发展,不断缩短其与世界顶尖对手的距离。

有人更认为,DeepSeek计划在4月发布的R2模型有可能直接挑战OpenAI宣传已久的GPT-5模型;一旦成事,中美两国发展人工智能的不同思路将迎来直接交锋。