DeepSeek︱传为改用国产GPU做准备 跳出NVIDIA限制

更新时间:14:10 2025-02-03 HKT
发布时间:14:10 2025-02-03 HKT

内地AI新创公司深度求索(DeepSeek),开发的大语言模型时,绕过美国人工智能巨头辉达(NVIDIA)的CUDA框架,有内媒报道,DeepSeek正为未来适配国产GPU晶片做准备。

据《快科技》和《腾讯网》报道,NVIDIA的「统一运算架构」(Compute Unified Device Architecture,CUDA),能大幅降低了研发大模型的难度,获全球开发商使用,令NVIDIA在人工智能发展上拥有垄断地位。

相关新闻:DeepSeek是甚么?与ChatGPT有何分别?一文睇清DeepSeek爆红原因、创办人梁文锋来头

美国科技网站Tom's Hardware报道,DeepSeek在使用Nvidia的H800晶片进行训练时,使用了Nvidia的底层硬件指令PTX(Parallel Thread Execution)语言,而不是高级编程语言CUDA。

相关新闻:DeepSeek「新玩法」算命炒股装修设计

北京航空航太大学副教授黄雷表示,绕过CUDA意味著DeepSeek可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细微性的操作。

报道指,DeepSeek拥有一些擅长写PTX语言的内部开发者,假如它之后使用中国国产GPU,其在硬体适配方面将会更得心应手,其只要了解这些硬体驱动提供的一些基本函数介面,就可以仿照辉达GPU硬体的程式设计介面,去写相关的代码,从而让自家大模型更加容易适配国产硬体。