DeepSeek据报用华为晶片训练失败 推迟发布新模型

更新时间:17:25 2025-08-14 HKT
发布时间:15:38 2025-08-14 HKT

内地人工智能初创DeepSeek据报因使用华为晶片训练失败,因而推迟发布新模型,反映中国晶片在关键任务上仍落后于美国竞争对手,凸显中国在技术自给自足面临的挑战。

被鼓励采用华为升腾处理器

据英国《金融时报》引述消息报道,DeepSeek今年1月发布R1模型后,被鼓励采用华为的升腾(Ascend)处理器,而非使用Nvidia的晶片来训练AI模型。然而,DeepSeek使用升腾晶片训练R2模型过程中遇到技术问题,促使其改用Nvidia晶片作训练,用华为晶片作推理。

事实上,DeepSeek-R2大模型原定5月推出,其后再传计划于8月15日至30日期间发布,但最终未有落实日子。