DeepSeek:RI模型训练成本仅29.4万美元

中国人工智能(AI)企业深度求索(DeepSeek)透露,开源AI模型DeepSeek-R1的训练费用仅为29.4万美元(37.7万新元),远低于美国同行公布的数字。

据路透社报道,上述数据出现在由DeepSeek团队撰写、星期三(9月17日)登上国际学术期刊《自然》(Nature)封面的论文中。

这篇由DeepSeek团队共同完成、创始人梁文锋担任通讯作者的论文,介绍了开源AI模型DeepSeek-R1采用的大规模推理模型训练方法,并称DeepSeek-R1的训练成本为29.4万美元,使用了512颗英伟达H800晶片。

今年1月发布的DeepSeek-R1初版论文并未包含上述消息。

训练用于AI聊天机器人的大型语言模型,主要花费在用强大的晶片集群连续数周或数月处理大量文字和代码上。

尽管美国AI巨头OpenAI未披露任何模型的具体成本,但公司首席执行官奥尔特曼(Sam Altman)曾在2023年说,基础模型训练花费远超1亿美元。

1 个赞

感觉突然就没人关注了

大模型的事,怎么能算蒸馏呢 :troll:

来的快去得也快

本质上还是想做空女大

Google的Gemini如果不算给上百个VP发的上亿刀工资的话,训练成本也差不多 :troll:

:yaoming:还真不算distill,在pretrain用了些gpt生成的语料,但这没法避免,现在哪去找没ai generated的文本库

3 个赞

刚入泥潭?你和这id较劲干嘛 :yaoming:

国籍不对,如果是美国公司搞出来的,就是大热start-up

1 个赞

买AI PUT?

不懂AI

所以除了医疗、基建、吃喝、打车、服务,就练人工智能训练模型都是中国的成本和开销低吗?

一语惊醒梦中人

deepseek实际用起来不太舒服啊 十次提问七八次繁忙 写的代码也不如同时期的claude.. 不过提出的深度思考现在都在被用..

1 个赞

电便宜就都便宜

首先,openai的一亿美元有多少水分还不知道呐。啥东西到了美国都会变得巨大,比如地里的植物,比如各种工程的预算

之前还有一篇文章,calling for a few trillion dollars investment in AI.

跟 23 年的比,肯定差距挺大的,而且当年说这么多也是造势

笑死。

Deepseek蒸馏没蒸馏GPT咱不说。GPT搞了这么多没版权的书啊杂志啊网页啊,我看你们挺支持的。偷到自己家就算自己的了对么?

不管怎么样,deepseek确实open weight了,这我肯定比gpt支持他 :new_moon_face:

电便宜,甚至很多硬件和设施都是政府补贴的产物,便宜是正常的。

但是这么便宜,那确实还是有点东西的。