友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com
业内:DeepSeek训练基于英伟达CUDA
9
0
近七日浏览最多
最新文章
来源:新浪科技
#专家称想破英伟达生态仍无解#【创新工场王震翔:DeepSeek相关训练仍基于英伟达CUDA生态】在新浪科技《智客星球》发起的主题为《苹果公司为何选阿里?DeepSeek有大棋?》微博连麦活动中,创新工场执行董事王震翔认为,以现在DeepSeek的趋势,用户的token消耗比它的训练消耗还要大,所以要看英伟达的股价,要对这个来做判断,要基于成本去思考,而这些之前还基于英伟达的CUDA生态形成的,所以他强调理性看待DeepSeek“既不要尬黑也不要尬吹”。
为什么OpenAI做的好,它是强绑定了微软,和微软的相关服务一起磨合,通过几十万卡级别一起去训练。DeepSeek本身做量化对于这个磨合本身是有能力的,模型训练的过程,一个GPU比如说它里面放数据,一个GPU里面放模型,这两个跑一遍,然后这个模型训练好了,但这其中有大量的空间可以做排列和优化,他表示,DeepSeek更厉害的是能够将排列和优化等能力做到更好。(新浪科技)
友情提示
本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!
联系邮箱:1042463605@qq.com