商湯「日日新」發佈開源模型評測分數勝GPT-5及Gemini-3-Pro

更新時間：17:52 2025-12-01 HKT
發佈時間：17:52 2025-12-01 HKT

商湯科技（020）「日日新」大模型正式發佈開源SenseNova-SI系列模型，該模型在多個權威評測基準的空間理解和推理能力測試中，表現大幅領先同量級開源多模態大模型，並超越GPT-5和Gemini-3-Pro等國際頂尖閉源模型。SenseNova-SI有助讓車輛及機械人更準確辨識周邊物件的距離、位置、移動方向等，進一步推動自動駕駛和機械人技術的發展。

商湯打造了日日新·空間智能大模型系列SenseNova-SI，當中包括2B（擁有約20億參數）和 8B（擁有約80億參數）兩個規格。

5個評測中平均獲得60分

業界有多個權威模型基準測試，透過讓各模型分別回答大量有關空間理解及推理能力的題目，評估其能力。SenseNova-SI及多個AI模型，在上述基準測試中分別回答了約1,000至8,000題題目，表現各異。

以100分為滿分，SenseNova-SI-1.1-8B模型在五個評測中平均獲得60分，大幅領先41.3分的Qwen3-VL-8B及其他開源通用多模態模型。另外，GPT-5及Gemini-3-Pro-Preview頂級閉源模型，分別為52.1分及56.2分，雖然SenseNova-SI-1.1-8B的模型規格較小，但其表現亦較前兩者優勝。

SenseNova-SI此次性能提升，源於商湯提出空間能力分類體系和過往積累多樣化的數據，團隊採用系統化的方法擴充空間理解數據的規模，首次在空間智能領域驗證了「尺度效應」，即通過高質量、大規模數據訓練，可顯著提升模型的空間認知能力。

事實上，今年7月，商湯正式發佈「悟能」具身智能平台，該平台以「開悟」世界模型為核心引擎，旨在為機器人和智能設備提供在物理世界中自主探索和進化的能力。

此次發佈的空間智能大模型SenseNova-SI，與「開悟」世界模型相輔相成，將更好地解決多模態模型從數碼空間走向物理世界的基礎挑戰，並在未來進一步推動AI在自動駕駛、機器人等場景的應用。

即睇《亂世投資》專頁↓