DeepSeek与清华大学合作 盼降低AI模型训练成本
更新时间:15:57 2025-04-07 HKT
发布时间:15:57 2025-04-07 HKT
发布时间:15:57 2025-04-07 HKT
据彭博报道,DeepSeek正与清华大学合作,致力于减少AI模型所需的训练量,以降低营运成本。同时,DeepSeek将新模型命名为DeepSeek-GRM,并计划以开源方式发布。
报道指出,DeepSeek与清华的研究人员合作发表论文,详述了一种新颖的强化学习方法,旨在提高模型效率。据研究人员介绍,这种新方法通过奖励更准确和易于理解的回应,帮助AI模型更好地符合人类偏好。
这种强化学习在特定应用领域,已被证明能加速AI任务,但将其扩展到更广泛的应用仍然具有挑战性,DeepSeek团队正尝试通过称为「self-principled critique tuning」的方法解决该问题。根据论文,该方法在各项基准测试中都优于现有方法和模型,并且能以更少的计算资源实现更好的性能。
另一方面,其他AI开发商包括阿里巴巴(9988)和OpenAI亦在推进新领域,以改善AI模型在实时执行任务时的推理和自我完善能力。

















