商汤「日日新」发布开源模型评测分数胜GPT-5及Gemini-3-Pro

更新时间：17:52 2025-12-01 HKT
发布时间：17:52 2025-12-01 HKT

商汤科技（020）「日日新」大模型正式发布开源SenseNova-SI系列模型，该模型在多个权威评测基准的空间理解和推理能力测试中，表现大幅领先同量级开源多模态大模型，并超越GPT-5和Gemini-3-Pro等国际顶尖闭源模型。SenseNova-SI有助让车辆及机械人更准确辨识周边物件的距离、位置、移动方向等，进一步推动自动驾驶和机械人技术的发展。

商汤打造了日日新·空间智能大模型系列SenseNova-SI，当中包括2B（拥有约20亿参数）和 8B（拥有约80亿参数）两个规格。

5个评测中平均获得60分

业界有多个权威模型基准测试，透过让各模型分别回答大量有关空间理解及推理能力的题目，评估其能力。SenseNova-SI及多个AI模型，在上述基准测试中分别回答了约1,000至8,000题题目，表现各异。

以100分为满分，SenseNova-SI-1.1-8B模型在五个评测中平均获得60分，大幅领先41.3分的Qwen3-VL-8B及其他开源通用多模态模型。另外，GPT-5及Gemini-3-Pro-Preview顶级闭源模型，分别为52.1分及56.2分，虽然SenseNova-SI-1.1-8B的模型规格较小，但其表现亦较前两者优胜。

SenseNova-SI此次性能提升，源于商汤提出空间能力分类体系和过往积累多样化的数据，团队采用系统化的方法扩充空间理解数据的规模，首次在空间智能领域验证了「尺度效应」，即通过高质量、大规模数据训练，可显著提升模型的空间认知能力。

事实上，今年7月，商汤正式发布「悟能」具身智能平台，该平台以「开悟」世界模型为核心引擎，旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。

此次发布的空间智能大模型SenseNova-SI，与「开悟」世界模型相辅相成，将更好地解决多模态模型从数码空间走向物理世界的基础挑战，并在未来进一步推动AI在自动驾驶、机器人等场景的应用。

即睇《乱世投资》专页↓