大棋盘︱立法会推实时字幕 应对「半咸淡」广东话有法 「港漂」洪雯:AI比真人听还准确

更新时间:08:34 2025-06-17 HKT
发布时间:08:34 2025-06-17 HKT

人工智能大时代,无论政府、机构以至普罗打工仔,皆要善用AI提升工作效率。立法会前年与内地AI龙头企业科大讯飞合作,推出智慧誊录系统「智识听」,引入智能语音转文字技术,用于逐字记录立法会会议,大为提升撰写会议纪录效率。据闻「智识听」即将再升级,短期内在大会推出实时字幕功能,即使议员发言中英夹杂、发音「唔咸唔淡」,系统亦有方法应对。

「智识听」可凭声认人 

目前「智识听」可实时速录及即场修改会上发言,秘书处则在幕后修正错别字或同音异字,已广泛在大会及委员会会议应用。系统亦可把议员发言的口语,迅速翻译成书面语,并可「凭声认人」,同时设有中英双向翻译功能作逐字记录。

可及时修正口误等错误

大主席梁君彦本月初发帖提到,「智识听」已越来越叻,誊录准确率由之前约93%进一步提升至近96%,并与科大讯飞副总裁王玮会面,就优化立会AI项目交流。他预告将推出新服务,包括为立法会会议提供实时字幕,秘书处正进行测试,期望短期内在大会直播时推行。

实时字幕正在各会议进行测试,据悉每当会议开始,「智识听」会誊录议员、官员及其他与会者发言,实时将广东话转为书面语,誊录文字会导入字幕系统;倘有字幕出现严重错误,例如错误誊录、数字出错或发言者口误等,秘书处在幕后会即时修正。

议员发言不时「跟稿读」,断句未必清晰,幕后人员亦会修正字幕,令句子更易读及完整,系统随即自动将文字加至直播画面,成为字幕。港人说话特色之一是中英夹杂,议员亦不例外,据知届时字幕均会全部显示,若发言者以全英语发言,字幕则只会誊录为英文。实时字幕连同会议直播,可在立法会官网、手机程式等收看。

尚海龙料字幕准确度理想 AI暂无认错其声音

具创科背景的「港漂」议员尚海龙表示,从技术角度而言,实时字幕早在2011年已开始发展,现时立会愿踏出一步,在直播会议使用新技术,属「勇于创新」之举,尤其会议涉及两文三语,且有议员母语是普通话,讲广东话难免有不标准情况。

他指目前89名议员发言,可交给AI持续地训练,已听惯了议员口音,再联系上下文理,相信实时字幕准确度非常理想,若有小错亦无伤大雅。他笑言,AI暂无认错其声音和发言内容,自己广东话「唔系咁差」。

「智识听」近期在一个表扬人工智能应用的颁奖礼获奖,据闻科大讯飞董事长刘庆峰在不同场合均推介「智识听」,更自豪地称即使是「极不标准」的广东话,AI字幕也可转换成标准广东话,更以「港漂」议员、广东话「半咸淡」的洪雯作例子。

洪雯称「唔怕俾人笑」 AI准确率「比真人听更准」

洪雯向笔者表示,立法会AI系统以她发音作素材,训练识别广东话功能,笑言AI准确率「比真人听还准确」,而自己亦「唔怕俾人笑」。不过她不忘强调,自问准备发言非常用心,内容有质量,因此日后推出实时字幕后,可帮助更多人清楚了解其发言内容,而非被口音「吸引」。她又指,曾在不同AI询问关于自己资料,发现AI会捏造事实,直言「AI取代唔到我」。

无论是「米线阿姐式」口音,抑或「明张目胆」用错成语被修正,实时字幕无疑有助公众更好理解会议内容,但要引起社会对议会关注度,官员和议员们提升发言质素,也必不可少。

聂风