DeepSeek与清华大学合作盼降低AI模型训练成本

更新时间：15:57 2025-04-07 HKT
发布时间：15:57 2025-04-07 HKT

据彭博报道，DeepSeek正与清华大学合作，致力于减少AI模型所需的训练量，以降低营运成本。同时，DeepSeek将新模型命名为DeepSeek-GRM，并计划以开源方式发布。

报道指出，DeepSeek与清华的研究人员合作发表论文，详述了一种新颖的强化学习方法，旨在提高模型效率。据研究人员介绍，这种新方法通过奖励更准确和易于理解的回应，帮助AI模型更好地符合人类偏好。

这种强化学习在特定应用领域，已被证明能加速AI任务，但将其扩展到更广泛的应用仍然具有挑战性，DeepSeek团队正尝试通过称为「self-principled critique tuning」的方法解决该问题。根据论文，该方法在各项基准测试中都优于现有方法和模型，并且能以更少的计算资源实现更好的性能。

另一方面，其他AI开发商包括阿里巴巴（9988）和OpenAI亦在推进新领域，以改善AI模型在实时执行任务时的推理和自我完善能力。

即睇《乱世投资》专页↓