港聞

娛樂

最Hit

即時

中國

國際

星島申訴王

財經

地產

生活

健康

教育

體育

大灣區

專欄

馬經

TV

PLUS

阿里推出及開源ThinkSound 可用AI自動為影片加音效

阿里推出及開源ThinkSound 可用AI自動為影片加音效

更新時間：14:16 2025-07-16 HKT
發佈時間：14:16 2025-07-16 HKT

阿里推出及開源ThinkSound 可用AI自動為影片加音效

阿里巴巴（9988）近日正式推出及開源其首款支援鏈式推理（Chain-of-Thought，CoT）的音訊產生模型ThinkSound，該模型基於視訊、文字或音訊輸入，透過思維鏈技術，能夠分析視訊畫面的場景、動作與情感，實現高保真、強同步的空間音訊生成，標誌着AI音訊從「看圖配音」到「結構化理解畫面」的跨越，猶如專業AI音效師。

核心在於多模態AI架構

據內媒報道，ThinkSound的核心優勢在於其多模態AI架構，融合了電腦視覺、自然語言處理與音訊生成技術，其中電腦視覺演算法能夠逐格分析影片內容，理解物體互動、環境背景及人物行為，進而產生高度契合的音效與音景，例如在自然場景中，可產生流水或鳥鳴聲；在都市場景中，則能還原車輛鳴笛與人群喧鬧。

此外，ThinkSound的演算法亦確保音訊與視訊精準對齊，支援包括MP4、MOV、AVI和MKV在內的多種視訊格式，相容於從標清到4K分辨率，滿足不同創作需求。根據官方數據顯示，ThinkSound在視訊及音訊生成基準測試中位居業界前列，展現了其強大的技術實力。

大幅降低AI音效產生門檻

報道又提到，ThinkSound大幅降低了AI音效產生的技術門檻，使中小型創作者、獨立開發者及學術研究人員能夠輕鬆接觸專業級音效產生工具。同時，該模型也提供互動式編輯功能，支援透過點擊或語言指令對特定音效進行精細調整，大大提升創作彈性。

↓即睇減息部署↓

↓即睇減息部署↓

最Hit

黃泰來導演離世丨劉美君18歲不顧媽媽反對嫁黃泰來 10年婚姻誕兩子女曾指產後好痛苦

黃泰來導演離世丨劉美君18歲不顧媽媽反對嫁黃泰來 10年婚姻誕兩子女曾指產後好痛苦

9小時前

自提點逼爆職員薪酬曝光嘆辛酸連做17小時員工怒斥客人：點解你哋咁自私唔畀我走｜Juicy叮

自提點逼爆職員薪酬曝光嘆辛酸連做17小時員工怒斥客人：點解你哋咁自私唔畀我走｜Juicy叮

9小時前

44歲女星宣布退出娛樂圈 98年爆紅之際患子宮頸癌停工離婚後再遇癌魔年初病情惡化

44歲女星宣布退出娛樂圈 98年爆紅之際患子宮頸癌停工離婚後再遇癌魔年初病情惡化

6小時前

黃泰來導演離世｜黃泰來是樂易玲初戀男友傳為劉美君分手？外表粗獷鐵漢柔情用極端方法醫怪病

黃泰來導演離世｜黃泰來是樂易玲初戀男友傳為劉美君分手？外表粗獷鐵漢柔情用極端方法醫怪病

9小時前

深圳廣州免費直通巴士！7月暑假限定一程直達天河人氣商場附預約教學

深圳廣州免費直通巴士！7月暑假限定一程直達天河人氣商場附預約教學

2025-07-15 19:15 HKT

申請人質疑房委會無理解其早出晚歸情況，安排凌晨突擊家訪，收回公屋對她不公。

公屋住戶被沒收單位提司法覆核指零耗水耗電因在妹妹家洗澡洗衣早出晚歸不開燈

12小時前

$66嘆尖沙咀酒店自助餐！再臨閣快閃1折任食西冷/Häagen-Dazs雪糕/即做甜品

$66嘆尖沙咀酒店自助餐！再臨閣快閃1折任食西冷/Häagen-Dazs雪糕/即做甜品

2025-07-15 17:42 HKT

出軌被捉姦在床男星曾言退圈潛水3個月突發「勵志文」：回報支持我的你們網民：笑死人

出軌被捉姦在床男星曾言退圈潛水3個月突發「勵志文」：回報支持我的你們網民：笑死人

13小時前

JUPAS改選2025｜DSE考獲20、21分可入港大/中大/科大嗎？盤點20-29分有機會入讀的課程

JUPAS改選2025｜DSE考獲20、21分可入港大/中大/科大嗎？盤點20-29分有機會入讀的「3大」課程

19小時前

拼多多現包郵陷阱？用戶力數4大不滿位突發收取配送費/更改自提點網民提醒購買前留意1點

拼多多現包郵陷阱？用戶力數4大不滿位突發收取配送費/更改自提點網民提醒購買前留意1點

14小時前