商汤「日日新」发布开源模型 评测分数胜GPT-5及Gemini-3-Pro
发布时间:17:52 2025-12-01 HKT
商汤科技(020)「日日新」大模型正式发布开源SenseNova-SI系列模型,该模型在多个权威评测基准的空间理解和推理能力测试中,表现大幅领先同量级开源多模态大模型,并超越GPT-5和Gemini-3-Pro等国际顶尖闭源模型。SenseNova-SI有助让车辆及机械人更准确辨识周边物件的距离、位置、移动方向等,进一步推动自动驾驶和机械人技术的发展。
商汤打造了日日新·空间智能大模型系列SenseNova-SI,当中包括2B(拥有约20亿参数)和 8B(拥有约80亿参数)两个规格。
5个评测中平均获得60分
业界有多个权威模型基准测试,透过让各模型分别回答大量有关空间理解及推理能力的题目,评估其能力。SenseNova-SI及多个AI模型,在上述基准测试中分别回答了约1,000至8,000题题目,表现各异。
以100分为满分,SenseNova-SI-1.1-8B模型在五个评测中平均获得60分,大幅领先41.3分的Qwen3-VL-8B及其他开源通用多模态模型。另外,GPT-5及Gemini-3-Pro-Preview顶级闭源模型,分别为52.1分及56.2分,虽然SenseNova-SI-1.1-8B的模型规格较小,但其表现亦较前两者优胜。
SenseNova-SI此次性能提升,源于商汤提出空间能力分类体系和过往积累多样化的数据,团队采用系统化的方法扩充空间理解数据的规模,首次在空间智能领域验证了「尺度效应」,即通过高质量、大规模数据训练,可显著提升模型的空间认知能力。
事实上,今年7月,商汤正式发布「悟能」具身智能平台,该平台以「开悟」世界模型为核心引擎,旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。
此次发布的空间智能大模型SenseNova-SI,与「开悟」世界模型相辅相成,将更好地解决多模态模型从数码空间走向物理世界的基础挑战,并在未来进一步推动AI在自动驾驶、机器人等场景的应用。

















