DeepSeek与清华大学合作 盼降低AI模型训练成本
更新时间:15:57 2025-04-07 HKT
发布时间:15:57 2025-04-07 HKT
发布时间:15:57 2025-04-07 HKT
据彭博报道,DeepSeek正与清华大学合作,致力于减少AI模型所需的训练量,以降低营运成本。同时,DeepSeek将新模型命名为DeepSeek-GRM,并计划以开源方式发布。
报道指出,DeepSeek与清华的研究人员合作发表论文,详述了一种新颖的强化学习方法,旨在提高模型效率。据研究人员介绍,这种新方法通过奖励更准确和易于理解的回应,帮助AI模型更好地符合人类偏好。
这种强化学习在特定应用领域,已被证明能加速AI任务,但将其扩展到更广泛的应用仍然具有挑战性,DeepSeek团队正尝试通过称为「self-principled critique tuning」的方法解决该问题。根据论文,该方法在各项基准测试中都优于现有方法和模型,并且能以更少的计算资源实现更好的性能。
另一方面,其他AI开发商包括阿里巴巴(9988)和OpenAI亦在推进新领域,以改善AI模型在实时执行任务时的推理和自我完善能力。
最Hit
郑少秋疑因丧女神隐3年 珍贵影片流出需搀扶瘦如纸板人 粉丝心酸:边看边落泪
2026-03-13 15:00 HKT
旺角小食店每晚大排长龙!港女好奇「真系咁好食?」 网民齐齐力推1物:系最好食,没有之一!
2026-03-13 17:32 HKT
抗癌中学阿Sir众筹被揭生活奢华求新手机?张继聪竟受牵连 Coffee曾捐钱:估唔到件事发酵到咁
2026-03-13 19:00 HKT
星岛申诉王 | 港妈为癌末丈夫众筹被揭全身名牌 妈妈群组呻后悔捐钱:个心有条刺
2026-03-13 18:38 HKT

















