AI編程「越幫越忙」掀成本危機 出錯率高人類1.7倍 亞馬遜Uber成「代幣最大化」苦主

更新時間:15:55 2026-05-30 HKT
發佈時間:15:55 2026-05-30 HKT

AI編程工具在近年已成為開發人員不可或缺的輔助,但多項最新研究與企業數據顯示,AI雖然顯著提升了編碼速度,卻未能保證代碼質量,甚至可能「越幫越忙」。AI研究實驗室METR及新加坡管理大學(SMU)等機構近期發表的報告警告,AI生成的代碼隱含大量錯誤,導致企業面臨沉重的長期維護成本。與此同時,電商龍頭亞馬遜(Amazon)及網約車平台Uber更因員工過度依賴AI,導致成本超標。

開發人員對AI產生深度依賴

據TechCrunch報道,權威AI研究實驗室METR於今年2月發表一項調查。研究人員原本計劃重啟一項在2025年開展的AI編程生產力研究,對比開源開發人員純人手編程與使用AI輔助的時間差異。然而,實驗最終卻無法進行,原因是當前的開發人員已無法離開AI,甚至不願意為了配合研究而短暫重回「純人手」工作。

METR改在5月發布了一項問卷調查,讓技術人員自行回報使用AI所帶來的生產力提升。 技術人員普遍認為AI令其工作效率倍增,為企業創造了雙倍價值。然而,市場上陸續浮現的實際數據與報道,正打破這種自我幻覺。

「代幣最大化」趨勢走到盡頭

事實上,2026年科技界掀起一股被稱為「Tokenmaxxing(代幣最大化)」的熱門趨勢,即員工消耗的AI使用量(Token)被作為工作生產力的指標。不過,該趨勢或許已走到盡頭。

《金融時報》早前曾報道,亞馬遜已終止內部用於追蹤員工AI使用量的排行榜「Kirorank」。原因是員工為了「衝榜」而過度且濫用AI代理(AI Agents),導致公司成本飆升,員工行為證明AI的高頻率使用並不等同於實際生產力的提升。

另外,據《The Information》報道,網約車巨頭Uber在今年前4個月,就已經耗盡全年的AI預算。Uber營運總監Andrew Macdonald坦言,儘管AI方面的開支巨大,但至今仍未見到其對項目進展或生產力帶來實質可測的增長。

錯誤率高1.7倍 企業恐陷維護無期徒刑

除了成本失控,AI生成代碼的質量問題更是一大隱憂。著名程式員兼作家James Shore在Hacker News上撰寫的文章指出,「你現在寫代碼的速度快了一倍?那你最好祈禱你的維護成本能減半,否則你將大禍臨頭。你只是在用短暫的速度提升,來換取長期的維護奴役。」

而數據支持了這一觀點。網絡可靠性工程初創公司Entelligence AI創辦人兼首席執行官Aiswarya Sankar透露,目前企業竟然將多達44%的Token預算,花在修復由AI自身生成的代碼漏洞(Bug)上。代碼審查工具公司CodeRabbit在分析後亦指出,AI生成的代碼所產生的問題,比人類親手編寫的高出1.7倍。

此外,新加坡管理大學(SMU)於今年4月發表研究報告警告,「AI生成的代碼可能會為實際的軟件項目引入長期的維護成本」。

專家:AI僅屬初階至中階水平

開發出市場首款AI編程代理「Devin」的Cognition創辦人兼首席執行官Scott Wu坦言,雖然Devin能夠獨立執行部分任務,但若以能力評級,目前的技術水準僅介乎「初階至中階程式員」之間,絕非可以完全放手不管的方案。

新加坡管理大學的研究人員建議,企業應採取更人性化的管理策略。程式員需要像熟悉自己常用的編程語言一樣,深度了解AI在哪些任務上擅長或笨拙。企業必須為AI量身訂造嚴謹質量保證(QA)系統,並像審查「初級開發人員」的工作一樣,仔細檢視AI生成的每一行代碼。