商湯「日日新」發佈開源模型 評測分數勝GPT-5及Gemini-3-Pro
發佈時間:17:52 2025-12-01 HKT
商湯科技(020)「日日新」大模型正式發佈開源SenseNova-SI系列模型,該模型在多個權威評測基準的空間理解和推理能力測試中,表現大幅領先同量級開源多模態大模型,並超越GPT-5和Gemini-3-Pro等國際頂尖閉源模型。SenseNova-SI有助讓車輛及機械人更準確辨識周邊物件的距離、位置、移動方向等,進一步推動自動駕駛和機械人技術的發展。
商湯打造了日日新·空間智能大模型系列SenseNova-SI,當中包括2B(擁有約20億參數)和 8B(擁有約80億參數)兩個規格。
5個評測中平均獲得60分
業界有多個權威模型基準測試,透過讓各模型分別回答大量有關空間理解及推理能力的題目,評估其能力。SenseNova-SI及多個AI模型,在上述基準測試中分別回答了約1,000至8,000題題目,表現各異。
以100分為滿分,SenseNova-SI-1.1-8B模型在五個評測中平均獲得60分,大幅領先41.3分的Qwen3-VL-8B及其他開源通用多模態模型。另外,GPT-5及Gemini-3-Pro-Preview頂級閉源模型,分別為52.1分及56.2分,雖然SenseNova-SI-1.1-8B的模型規格較小,但其表現亦較前兩者優勝。
SenseNova-SI此次性能提升,源於商湯提出空間能力分類體系和過往積累多樣化的數據,團隊採用系統化的方法擴充空間理解數據的規模,首次在空間智能領域驗證了「尺度效應」,即通過高質量、大規模數據訓練,可顯著提升模型的空間認知能力。
事實上,今年7月,商湯正式發佈「悟能」具身智能平台,該平台以「開悟」世界模型為核心引擎,旨在為機器人和智能設備提供在物理世界中自主探索和進化的能力。
此次發佈的空間智能大模型SenseNova-SI,與「開悟」世界模型相輔相成,將更好地解決多模態模型從數碼空間走向物理世界的基礎挑戰,並在未來進一步推動AI在自動駕駛、機器人等場景的應用。

















