DeepSeek推V4新模型 市場憧憬國產晶片需求增 中芯曾飆逾11%

更新時間:17:23 2026-04-24 HKT
發佈時間:17:23 2026-04-24 HKT

中國AI初創企業DeepSeek宣布推出全新開源AI旗艦模型「V4 Flash」及「V4 Pro」系列,宣稱在編程基準測試表現出色並支援百萬級上下文窗口。受消息帶動,市場憧憬國產晶片需求增加,刺激半導體股份周五造好,中芯國際(981)曾飆逾11%。不過,公司坦言目前面臨算力緊張的情況,預料下半年採用華為晶片後成本方會顯著下降;同時,公司亦面臨美國政府針對其涉嫌違規使用英偉達晶片的審查。

支援百萬級上下文窗口

DeepSeek自推出R1模型後,相隔一年再推新模型,V4系列採用「混合注意力架構」(Hybrid Attention Architecture),支援高達100萬個Token的上下文窗口,意味著用戶可將整個代碼庫或長篇文件作為單一提示詞輸入。另外,DeepSeek表示,該模型在編程基準測試中表現頂級,並在推理和智能體任務方面取得重大進展。

資料顯示,該模型採用「專家混合」(MoE)技術,每項任務最多激活370億個參數,令推理成本遠低於同類前沿模型。惟公司強調,雖然V4性能較最頂尖模型仍落後約3至6個月,但其設計初衷是能夠部署於較廉價的基礎設施上,從根本上降低成本。

下半年引華為晶片降成本

DeepSeek在微信發文表示,受算力緊張影響,V4 Pro系列的服務容量極度有限。不過,公司預期今年下半年華為的昇騰950晶片計算集群投入運作後,模型定價將大幅下降。

受消息影響,市場憧憬新模型將帶動國產晶片需求,本港半導體股份周五造好。中芯國際股價曾飆升達11.7%,華虹半導體(1347)更急升逾19.4%。相較之下,競爭對手智譜(2513)相關股份則最多挫12.8%。

美國政府憂其違規用英偉達晶片

DeepSeek在海外市場則面臨監管及同業指控壓力,美國政府懷疑DeepSeek在內蒙古的數據中心,使用受出口禁令限制的英偉達 Blackwell處理器,美國官員去年已開始對此展開調查。此外,OpenAI及Anthropic早前指控DeepSeek透過「模型蒸餾」(Distillation)技術,利用對手模型的輸出數據來訓練自身AI能力。