DeepSeek低调发布V3新模型 保持开源兼降计算成本 令人质疑矽谷模式
更新时间:15:32 2025-03-25 HKT
发布时间:15:32 2025-03-25 HKT
发布时间:15:32 2025-03-25 HKT
中国人工智能初创DeepSeek周一低调发布了新模型「DeepSeek-V3-0324」,初步测试显示其可在消费级硬件上运行,打破大模型需要数据中心的传统思路;同时继续降低大模型能耗及计算成本,并保持开源以不断推动技术创新,引领内地AI行业迅速发展,令人对矽谷的封闭付费模式产生质疑。
指标超越Claude Sonnet 3.5
据内媒报道,DeepSeek在没有任何公告的情况下,在AI存储库Hugging Face上线新的DeepSeek-V3模型。
有AI研究员表示,该模型可配备M3 Ultra芯片的苹果电脑上,以每秒20个token的速度运行,意味数据中心并不是大模型的必要搭配。另一研究员亦在X上宣称,在内部工作上测试了新版DeepSeek-V3后,发现它在测试的所有指标上都有了巨大飞跃,更超越了甲骨文的Claude Sonnet 3.5,成为最好的非推理模型。
免费下载和使用令网民兴奋
此外,由于DeepSeek的模型都是开源模型,可供任何人免费下载和使用,与按月收取20美元费用的Claude Sonnet截然相反。另有网民更在社交平台X上表示,这相当于「免费获得法拉利」。
报道又提到,DeepSeek新模型的改变对于业内具有重大意义,一方面大大降低了大模型的能耗及计算成本,进一步动摇了华尔街对于顶级模型基础设施的投资规模假设;另一方面,中国人工智能行业对开源的广泛共识又迅速推动内地AI行业的发展,不断缩短其与世界顶尖对手的距离。
有人更认为,DeepSeek计划在4月发布的R2模型有可能直接挑战OpenAI宣传已久的GPT-5模型;一旦成事,中美两国发展人工智能的不同思路将迎来直接交锋。
最Hit
眼红大埔宏福苑大火灾民援助!? 网传过渡房屋「原居民」讯息:其实最穷嘅应该系我哋 惹网民群批
2025-12-09 15:07 HKT
连锁酒楼12月长者优惠!早茶点心孖宝$20.8 星期一至日适用
2025-12-09 14:39 HKT
爱回家2.0︱广东25年长寿剧《外来媳妇本地郎》大结局 网民:重头再睇
2025-12-08 16:19 HKT

















