开源模型震撼全球 解读DeepSeek三大争议|公民社会

更新时间:14:00 2025-05-14 HKT
发布时间:14:00 2025-05-14 HKT

事件

  • DeepSeek发布开源R1模型,震惊全球

人物 / 持份者

  • DeepSeek
  • 中国创科界

时间

  • 今年年初

地点

  • 中国
  • 全球

相关新闻:DeepSeek使用率急跌至3% 快手「可灵」获逾30%使用率

背景认知

R1模型一出全球狂热

中国AI初创公司DeepSeek于2023年7月17日成立,专注于开发先进的大语言模型和相关技术。DeepSeek在2025年1月20日推出最新人工智能推理模型「DeepSeek R1」,表示其性能比对美国OpenAI去年底才发布的「OpenAI O1」。

中国受制于美国的晶片管制,仍能以远低于其美国竞争者的成本和训练时间,推出成本低廉,而且性能与OpenAI相当的DeepSeek。

为了推动和鼓励开源社群以及产业生态的发展,DeepSeek R1发布时表示会同步开源模型权重,促进技术共享和加速技术的发展。与OpenAI不同,DeepSeekR1采用「Open Source」开源设计,即开放程式码,让人们可随意取用、开发。而DeepSeek亦在香港、内地,甚至美国的App Store及Play Store登上热门下载榜榜首,可见令全球为之狂热。

相关新闻:DeepSeek低调发布V3新模型 保持开源兼降计算成本 令人质疑矽谷模式 

印证中国科技实力

中国近年积极发展STEM专业(即科学、科技、工程及数学),DeepSeek的成功证明了中国教育系统培养高质素人才的实力。DeepSeek爆火的背后,标志着中国在AI科技人才素质和技术创新能力上的重大突破,亦充分证明了中国在人工智能研究领域不输美国,更体现了在全球人工智能研究领域,中国正以惊人的速度和质量崛起。
根据最新调查报告,2017至2022年间,中国发布的AI论文数量达到24.3万篇,占全球总量的25%,位居世界第一。DeepSeek出人意料地缩小了中国与美国在人工智能领域的差距。

DeepSeek创办人梁文锋
DeepSeek创办人梁文锋

相关文章:梁文锋 DeepSeek创始人|新闻人物

持份者观点

事件分析:三大争议

蒸馏技术侵权疑问

OpenAI指控DeepSeek使用「蒸馏」(distillation)技术,利用其模型输出来训练自家模型。这种技术让开发者通过更强大的模型输出,提升小型模型的效能。

虽然OpenAI的服务条款明确禁止用户「利用OpenAI的输出训练竞争模型」,但OpenAI也曾因训练数据的采集方式备受争议,例如使用大量网页数据和新闻报道内容的文本资料,更因此而被《纽约时报》等多间媒体告上法庭,同样有潜在侵权问题。因此,部分人认为其指控DeepSeek的立场站不住脚。而且大多数AI公司都会使用其他AI模型的输出来进行训练,这在业界并不罕见。

延伸阅读:AI与公民素养 从DeepSeek谈起|公民视野

整体开发成本未公开

有人质疑DeepSeek的低成本说法。坊间流传DeepSeek开发成本「550万美元」,其实是指DeepSeek-V3的训练成本,而非R1。而且DeepSeek并未正式宣称自己以如此低的成本达到OpenAI O1的水准。事实上,其整体研发投入,包括基础设施、硬体采购、数据处理、人力成本等,并不会比其他AI实验室少太多。此外,媒体常引用的「98%便宜」,实际上指的是DeepSeek API的定价相较于OpenAI API的价格差异,而非模型的训练成本。

另一方面,业界普遍认为,高成本的开发通常能够带来更高的质量保障和技术支持,如DeepSeek的开发成本确实较低,亦令外界质疑其产品能否维持长期稳定。

相关新闻:

DeepSeek与清华大学合作 盼降低AI模型训练成本

DeepSeek披露成本利润率 高达545%惊人水平

晶片出口管制

DeepSeek在资源有限的情况下成功开发出顶尖AI模型,这引发了部分业界人士的质疑。现时全球半导体供应紧张,获取顶级晶片变得越加困难。有报告指出DeepSeek可能通过第三方绕过美国对高阶晶片的出口管制,取得大量辉达(NVIDIA)晶片来支援其AI模型的开发。DeepSeek在获取这些高性能晶片时,有否遵循出口控制和进口规定,美国商务部正在调查DeepSeek是否使用了被禁止运往中国的美国晶片。

DeepSeek表示使用了辉达的H800晶片,这款晶片在2023年可以合法购买。美国政府也正在调查DeepSeek是否通过新加坡的第三方实体,而取得高效能的辉达晶片。

相关新闻:

传辉达计划7月为中国推降级版H20晶片 应对美出口限制

据报腾讯、阿里等中企首季斥1248亿买Nvidia晶片

重点关键字

#人工智能 #开源设计 #蒸馏技术 #半导体供应链 #AI竞赛 #中美博弈

文:时光 图:星岛图片库、网上图片

DeepSeek技术应用

聊天机械人 聊天机械人超萌入屋|整合ChatGPT/DeepSeek/豆包AI 表情鬼马语音手势互动  最平百多元可到手

汽车 宝马拟引入DeepSeek技术 应用国产车型

教育 AI热潮引领教育界转型 城大引入Chatbot系统 「学生如有24小时个人导师」

金融 人人都Gen AI 唔通金融机构都识用AI咩|林小珍

股票 富途接入DeepSeek 「牛牛AI」助解答查询

救灾 缅甸地震︱DeepSeek协助救灾 7小时开发中缅英互译系统

保险 港初创MediConCen应用AI及区块链技术 助医保理赔时间减半

直播 DeepSeek︱直播1天销售额¥3.3亿 AI生成「话术」快人力10倍

对话服务平台 AI|生成式人工智能研发平台获捐2亿元 助研港产AI「港话通」对话服务平台

医疗 DeepSeek︱成都一医院百位医生同时求助 月中推「数码分身」供无休问诊

相关新闻:

DeepSeek引领港股价值重估 单季升逾15% IPO市场回暖 券商乘势推「AI助手」

李开复称AI大模型入门成本越来越高 改全面拥抱DeepSeek

华尔街再爆「算力怀疑论」 微软大量取消欧美数据中心租约 长远要靠AI Agent?

南韩投资者大举买入中资股 交易额大增200% 钟情电动车及AI等龙头股

荣耀拟5年投资780亿攻AI设备 料与Orange及Telefonica等合作

Nvidia业绩无助推动大市 累计升幅悉数蒸发 「DeepSeek令美股AI热降温」