AI愈慳算力愈缺晶片 | 莫灝楠

更新時間:17:02 2026-06-09 HKT
發佈時間:17:02 2026-06-09 HKT

成日聽人講:「依家啲 AI model又蒸餾又剩,唔使以前咁大算力都行到啦,咁晶片咪即係冇人要?晶片股要爆炸?」

最近SemiAnalysis出左份報告話Vera Rubin伺服器記憶體容量減半,嚇到早幾日美國所有半導體股大跌。

直接同你講結論:軟體幫手慳算力,非但唔會令半導體需求下跌,反而會刺激需求繼續上升。慳出嚟嘅算力,一瞬間就會俾全新、更複雜嘅需求填滿。

筆者GTC/Computex見聞

筆者早前去左台北睇Computex & GTC。筆者唔係咩電腦專家,好多野都係睇YouTube、跟兩位拍檔學。睇完一大堆機櫃同presentation之後,用超級Layman嘅語言講,而家啲機櫃分工越來越明確。一個Rack負責擺GPU、另一個擺CPU、DRAM、NVLink等等。密度越來越高,晶片越塞越多。GTC見到個CPU Rack,一個Rack放4粒CPU,每一粒U隔離有32條RAM,一個機櫃放256粒U,有幾多條RAM大家自己計下。

慳出嚟嘅算力 一秒鐘就會俾人塞爆

算力短缺嘅問題呢兩年黎講基本上係無窮無盡。軟體優化幫工程師慳咗算力?正啊!騰出嚟嘅資源,大家會即刻搶住用嚟做更極端嘅事:

模型越推越大:以前慳埋嘅算力,工程師會即刻攞去跑更高級、參數多幾倍嘅神經網絡,追求更全能嘅 AI。

多模態同連續思考(Reasoning):淨係處理文字就話夠啫,依家要 AI 即時生成高清片、行自動駕駛、甚至幾十個 AI Agent 自己內部開會幫你執成套 System。呢啲超複雜嘅任務,每行一步都食算力食到傻。

呢個情況喺經濟學有個term叫「杰文斯悖論」(Jevons Paradox):當一樣嘢嘅使用效率提高、成本平咗,大家唔係用少咗,而係會因為太抵玩而用得仲多。

慳算力絕對唔係半導體需求會跌嘅藉口

千祈唔好以為軟體進步,硬體廠就要乞食。事實上,好似 NVIDIA 老黃近期都講到明:「睇唔到短缺結束嘅盡頭」

就算硬體架構點樣微調、點樣幫個系統減磅,現實情況係成個 AI 產業鏈——由最上游嘅晶圓、先進封裝到記憶體,全部都嚴重供不應求。

門檻低咗,全人類一齊搶:軟體優化令算力要求降低,原本得 Big Tech 玩得起嘅 AI,依家連 Startup、中小企、甚至邊緣設備(手機、汽車、全屋家電)都行到。當每部機都要加塊 AI 晶片,呢個普及化嘅市場大到你想像唔到。

短缺起碼玩多幾年:老黃話,無論係超級電腦、AI PC 定智能機器人,全球嘅建設需求都去得好急,成個半導體供應鏈缺貨嘅狀況,起碼仲要持續好幾年。

當然股票升跌未必完全跟曬基本面情況,市場對硬件預期都可能過高,但起碼短期內行業無逆轉跡象。唔好周圍聽到啲鬼故就覺得AI就黎爆炸。