阿里推ThinkSound可自動加音效

更新時間:03:00 2025-07-17 HKT
發佈時間:03:00 2025-07-17 HKT

阿里巴巴(9988)近日正式推出及開源其首款支援鏈式推理(Chain-of-Thought,CoT)的音訊產生模型ThinkSound,該模型基於視訊、文字或音訊輸入,透過思維鏈技術,能夠分析視訊畫面的場景、動作與情感,實現高保真、強同步的空間音訊生成,標誌着AI音訊從「看圖配音」到「結構化理解畫面」的跨越,猶如專業AI音效師。