AI︱中大推出全球首個粵語大語言模型動態評測平台

更新時間:14:56 2025-10-30 HKT
發佈時間:14:56 2025-10-30 HKT

香港中文大學(中大)今日(30日)宣布推出全球首個專為粵語設計的動態評測平台及生態系統「CLEVA-Cantonese」。該平台通過建立公平、動態且具參考價值的評估基準,客觀檢視各類大語言模型對粵語的理解與支援程度,並為研究人員與開發者提供具參考價值的分析,助力粵語大語言模型的優化與實際應用。

AI︱檢視大語言模型對粵語支援程度 有助優化

中大禤永明系統工程與工程管理學講座教授、博智感知交互研究中心主任蒙美玲(右)表示,傳統評測方法難以直接應用於粵語評估。左為王歷偉。汪旭峰攝
中大禤永明系統工程與工程管理學講座教授、博智感知交互研究中心主任蒙美玲(右)表示,傳統評測方法難以直接應用於粵語評估。左為王歷偉。汪旭峰攝

有份領導研發此項目的中大禤永明系統工程與工程管理學講座教授、博智感知交互研究中心主任蒙美玲表示,「我們觀察到,儘管大語言模型在短時間內發展迅速,但其對香港粵語的支援仍相對薄弱。」她進一步指出,傳統評測方法難以直接應用於粵語評估,主因在於粵語的語法結構、發音與俗語表達具有高度獨特性,加上粵語語料相對稀缺,構建高質量評測數據仍為研究難點,因此全面評測必須依賴長期而動態的數據支持。

蒙美玲強調,若大語言模型缺乏足夠的粵語數據訓練,便無法理解粵語的獨特表達方式,而現時不少人對粵語大模型的表現存疑。她以粵語用詞「食水深」為例,該詞為香港常用俚語,但大語言模型則不能理解,因為沒有相關數據訓練;又例如粵語中「銀行」與「行街」的「行」字讀音不同,大語言模型亦有可能在理解上出錯。

目前「CLEVA-Cantonese」團隊已完成首輪評估,當中涵蓋多個國際與本地的大語言模型。結果顯示,即使是最新的型號,都仍難以完全掌握粵語細緻語義,在語法、發音及詞彙方面均有顯著提升空間。中大計算機科學與工程學系助理教授、CLEVA項目負責人王歷偉表示,「我們專注於評測並提供改進建議,讓業界包括公司與研究部門,能據此有效提升模型在粵語理解與生成上的表現。」他又指,共同推動跨語言大語言模型能即時惠及粵語社群。

AI︱ 談未來願景 從三大方向拓展平台

蒙美玲(右)表示,團隊計劃建立開放的評測平台。汪旭峰攝
蒙美玲(右)表示,團隊計劃建立開放的評測平台。汪旭峰攝

對於未來的願景,蒙美玲表示,團隊計劃建立開放的評測平台,供研究人員、開發者及機構使用,為發展更好的粵語大模型提供具體詳細的評測和建議。系統將採用最新模型進行多維度評估,從文化、語法、音譯及知識理解等層面,指出大模型的不足之處。開發者可依據評測結果,針對性地進行數據收集、模型架構設計與訓練方式調整,從而提升模型效能。

團隊亦將從「任務與數據」、「可信系統」與「跨學科合作」三大方向拓展平台,引入更多元的數據,評估模型風險與可信度,並推動跨領域協作,持續更新並共享多元數據資源,以促進語言學、教育及文化領域的研究合作。蒙美玲補充指,「中大在中文及粵語研究方面積累深厚,為平台發展提供了堅實基礎。」

記者 佘丹薇

延伸閱讀:

研究:小學教師已在教學中廣泛運用多種AI工具

張宇人、許冠文及劉兆佳等5人 獲中大頒授榮譽博士學位