开源模型震撼全球 解读DeepSeek三大争议|公民社会
发布时间:14:00 2025-05-14 HKT
事件
- DeepSeek发布开源R1模型,震惊全球

人物 / 持份者
- DeepSeek
- 中国创科界
时间
- 今年年初
地点
- 中国
- 全球
相关新闻:DeepSeek使用率急跌至3% 快手「可灵」获逾30%使用率
背景认知
R1模型一出全球狂热
中国AI初创公司DeepSeek于2023年7月17日成立,专注于开发先进的大语言模型和相关技术。DeepSeek在2025年1月20日推出最新人工智能推理模型「DeepSeek R1」,表示其性能比对美国OpenAI去年底才发布的「OpenAI O1」。
中国受制于美国的晶片管制,仍能以远低于其美国竞争者的成本和训练时间,推出成本低廉,而且性能与OpenAI相当的DeepSeek。
为了推动和鼓励开源社群以及产业生态的发展,DeepSeek R1发布时表示会同步开源模型权重,促进技术共享和加速技术的发展。与OpenAI不同,DeepSeekR1采用「Open Source」开源设计,即开放程式码,让人们可随意取用、开发。而DeepSeek亦在香港、内地,甚至美国的App Store及Play Store登上热门下载榜榜首,可见令全球为之狂热。

相关新闻:DeepSeek低调发布V3新模型 保持开源兼降计算成本 令人质疑矽谷模式
印证中国科技实力
中国近年积极发展STEM专业(即科学、科技、工程及数学),DeepSeek的成功证明了中国教育系统培养高质素人才的实力。DeepSeek爆火的背后,标志着中国在AI科技人才素质和技术创新能力上的重大突破,亦充分证明了中国在人工智能研究领域不输美国,更体现了在全球人工智能研究领域,中国正以惊人的速度和质量崛起。
根据最新调查报告,2017至2022年间,中国发布的AI论文数量达到24.3万篇,占全球总量的25%,位居世界第一。DeepSeek出人意料地缩小了中国与美国在人工智能领域的差距。

相关文章:梁文锋 DeepSeek创始人|新闻人物
持份者观点



事件分析:三大争议
蒸馏技术侵权疑问
OpenAI指控DeepSeek使用「蒸馏」(distillation)技术,利用其模型输出来训练自家模型。这种技术让开发者通过更强大的模型输出,提升小型模型的效能。
虽然OpenAI的服务条款明确禁止用户「利用OpenAI的输出训练竞争模型」,但OpenAI也曾因训练数据的采集方式备受争议,例如使用大量网页数据和新闻报道内容的文本资料,更因此而被《纽约时报》等多间媒体告上法庭,同样有潜在侵权问题。因此,部分人认为其指控DeepSeek的立场站不住脚。而且大多数AI公司都会使用其他AI模型的输出来进行训练,这在业界并不罕见。

整体开发成本未公开
有人质疑DeepSeek的低成本说法。坊间流传DeepSeek开发成本「550万美元」,其实是指DeepSeek-V3的训练成本,而非R1。而且DeepSeek并未正式宣称自己以如此低的成本达到OpenAI O1的水准。事实上,其整体研发投入,包括基础设施、硬体采购、数据处理、人力成本等,并不会比其他AI实验室少太多。此外,媒体常引用的「98%便宜」,实际上指的是DeepSeek API的定价相较于OpenAI API的价格差异,而非模型的训练成本。
另一方面,业界普遍认为,高成本的开发通常能够带来更高的质量保障和技术支持,如DeepSeek的开发成本确实较低,亦令外界质疑其产品能否维持长期稳定。

相关新闻:
晶片出口管制
DeepSeek在资源有限的情况下成功开发出顶尖AI模型,这引发了部分业界人士的质疑。现时全球半导体供应紧张,获取顶级晶片变得越加困难。有报告指出DeepSeek可能通过第三方绕过美国对高阶晶片的出口管制,取得大量辉达(NVIDIA)晶片来支援其AI模型的开发。DeepSeek在获取这些高性能晶片时,有否遵循出口控制和进口规定,美国商务部正在调查DeepSeek是否使用了被禁止运往中国的美国晶片。
DeepSeek表示使用了辉达的H800晶片,这款晶片在2023年可以合法购买。美国政府也正在调查DeepSeek是否通过新加坡的第三方实体,而取得高效能的辉达晶片。

相关新闻:
重点关键字
#人工智能 #开源设计 #蒸馏技术 #半导体供应链 #AI竞赛 #中美博弈
文:时光 图:星岛图片库、网上图片
DeepSeek技术应用
聊天机械人 聊天机械人超萌入屋|整合ChatGPT/DeepSeek/豆包AI 表情鬼马语音手势互动 最平百多元可到手
教育 AI热潮引领教育界转型 城大引入Chatbot系统 「学生如有24小时个人导师」
救灾 缅甸地震︱DeepSeek协助救灾 7小时开发中缅英互译系统
保险 港初创MediConCen应用AI及区块链技术 助医保理赔时间减半
直播 DeepSeek︱直播1天销售额¥3.3亿 AI生成「话术」快人力10倍
对话服务平台 AI|生成式人工智能研发平台获捐2亿元 助研港产AI「港话通」对话服务平台
医疗 DeepSeek︱成都一医院百位医生同时求助 月中推「数码分身」供无休问诊
相关新闻:
DeepSeek引领港股价值重估 单季升逾15% IPO市场回暖 券商乘势推「AI助手」
李开复称AI大模型入门成本越来越高 改全面拥抱DeepSeek
华尔街再爆「算力怀疑论」 微软大量取消欧美数据中心租约 长远要靠AI Agent?
南韩投资者大举买入中资股 交易额大增200% 钟情电动车及AI等龙头股
荣耀拟5年投资780亿攻AI设备 料与Orange及Telefonica等合作
Nvidia业绩无助推动大市 累计升幅悉数蒸发 「DeepSeek令美股AI热降温」

















