AI愈悭算力愈缺晶片 | 莫灏楠
发布时间:17:02 2026-06-09 HKT
成日听人讲:「依家啲 AI model又蒸馏又剩,唔使以前咁大算力都行到啦,咁晶片咪即系冇人要?晶片股要爆炸?」
最近SemiAnalysis出左份报告话Vera Rubin伺服器记忆体容量减半,吓到早几日美国所有半导体股大跌。
直接同你讲结论:软体帮手悭算力,非但唔会令半导体需求下跌,反而会刺激需求继续上升。悭出嚟嘅算力,一瞬间就会俾全新、更复杂嘅需求填满。
笔者GTC/Computex见闻
笔者早前去左台北睇Computex & GTC。笔者唔系咩电脑专家,好多野都系睇YouTube、跟两位拍档学。睇完一大堆机柜同presentation之后,用超级Layman嘅语言讲,而家啲机柜分工越来越明确。一个Rack负责摆GPU、另一个摆CPU、DRAM、NVLink等等。密度越来越高,晶片越塞越多。GTC见到个CPU Rack,一个Rack放4粒CPU,每一粒U隔离有32条RAM,一个机柜放256粒U,有几多条RAM大家自己计下。
悭出嚟嘅算力 一秒钟就会俾人塞爆
算力短缺嘅问题呢两年黎讲基本上系无穷无尽。软体优化帮工程师悭咗算力?正啊!腾出嚟嘅资源,大家会即刻抢住用嚟做更极端嘅事:
模型越推越大:以前悭埋嘅算力,工程师会即刻攞去跑更高级、参数多几倍嘅神经网络,追求更全能嘅 AI。
多模态同连续思考(Reasoning):净系处理文字就话够啫,依家要 AI 即时生成高清片、行自动驾驶、甚至几十个 AI Agent 自己内部开会帮你执成套 System。呢啲超复杂嘅任务,每行一步都食算力食到傻。
呢个情况喺经济学有个term叫「杰文斯悖论」(Jevons Paradox):当一样嘢嘅使用效率提高、成本平咗,大家唔系用少咗,而系会因为太抵玩而用得仲多。
悭算力绝对唔系半导体需求会跌嘅借口
千祈唔好以为软体进步,硬体厂就要乞食。事实上,好似 NVIDIA 老黄近期都讲到明:「睇唔到短缺结束嘅尽头」
就算硬体架构点样微调、点样帮个系统减磅,现实情况系成个 AI 产业链——由最上游嘅晶圆、先进封装到记忆体,全部都严重供不应求。
门槛低咗,全人类一齐抢:软体优化令算力要求降低,原本得 Big Tech 玩得起嘅 AI,依家连 Startup、中小企、甚至边缘设备(手机、汽车、全屋家电)都行到。当每部机都要加块 AI 晶片,呢个普及化嘅市场大到你想像唔到。
短缺起码玩多几年:老黄话,无论系超级电脑、AI PC 定智能机器人,全球嘅建设需求都去得好急,成个半导体供应链缺货嘅状况,起码仲要持续好几年。
当然股票升跌未必完全跟晒基本面情况,市场对硬件预期都可能过高,但起码短期内行业无逆转迹象。唔好周围听到啲鬼故就觉得AI就黎爆炸。

















