DeepSeek-R1
开发者 | 深度求索 |
---|---|
首次发布 | 2025年1月20日 |
源代码库 | |
前任 | DeepSeek-R1-Lite |
类型 | |
许可协议 | MIT |
网站 | www |
DeepSeek-R1是深度求索(DeepSeek)于2025年1月20日发布的人工智能大型语言模型,专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1[1]。
开发
[编辑]DeepSeek-R1的论文中没有公布其训练成本等细节。[2]不过此前的论文中,DeepSeek透露其训练使用的是英伟达因为美国出口管制而针对中国市场特供的低配版GPU H800,训练成本为557.6万美元,远低于类似西方公司的闭源模型。[1][3][4]外界预估R1的训练成本也不会比V3高多少,或在600万美元上下。[5]
使用
[编辑]DeepSeek-R1使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。用户可以在DeepSeek官方网站和App使用官方提供的服务。
DeepSeek-R1上线时提供的 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元,输出API价格仅仅只有OpenAI o1的3%。[6]
外界反应
[编辑]1月27日,DeepSeek超越ChatGPT,登顶苹果App Store美国区免费APP下载排行榜。[7]
DeepSeek-R1爆火,引发全球投资者大量抛售人工智能相关股票。1月27日,英伟达美股股价下跌近17%,单日市值蒸发5890亿美元,为美国股市历史上最大。[8][9]
DeepSeek-R1发布后不久,Meta首席执行官马克·扎克伯格就宣布,Meta计划在2025年投入超600亿美元,加大对人工智能的投入。[5]据媒体1月27日报道,Meta成立了四个研究小组,专门研究DeepSeek的模型。[10]其中两个小组研究其开发者如何降低训练和运行DeepSeek的成本,第三个小组研究训练模型可能使用了哪些数据,第四个小组研究基于DeepSeek模型属性重构其LLaMA模型的新技术。[11]
OpenAI表示,其有证据表明DeepSeek使用OpenAI的专有模型来训练自己的开源模型,这违反了OpenAI的服务条款。[12]
参见
[编辑]参考资料
[编辑]- ^ 1.0 1.1 DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?. 美国之音. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-28) (中文).
- ^ DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 (PDF). [2025-02-01]. (原始内容存档 (PDF)于2025-01-29).
- ^ DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3 (PDF). [2025-02-01]. (原始内容存档 (PDF)于2025-02-01).
- ^ 孙铭蔚. 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 澎湃新闻. 2025-01-22 [2025-01-28]. (原始内容存档于2025-01-26) (中文(中国大陆)).
- ^ 5.0 5.1 吴遇利. DeepSeek“恐惧感”支配硅谷!Meta被曝组建4个小组专门研究. 澎湃新闻. 2025-01-27 [2025-01-29] (中文(中国大陆)).
- ^ 郑远方. “价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠. 财联社. 2025-01-28 [2025-01-28] (中文(中国大陆)).
- ^ 李潇潇, 胡含嫣. DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜. 澎湃新闻. 2025-01-27 [2025-01-29]. (原始内容存档于2025-01-27).
- ^ 日本放送协会. ナスダック大幅下落 中国企業ディープシーク 生成AI開発受け. NHKニュース. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-30) (日语).
- ^ 何浩. 英伟达市值蒸发近6000亿美元,规模创美股史上最大,市值跌至全球第三. 华尔街见闻. 2025-01-28 [2025-01-28]. (原始内容存档于2025-01-28) (中文(中国大陆)).
- ^ Meta Scrambles After Chinese AI Equals Its Own, Upending Silicon Valley. The Information. 2024-01-27 [2025-01-29]. (原始内容存档于2025-01-30) (英语).
- ^ DeepSeek震撼硅谷 Meta组建四个研究小组专门破解. 财联社. 2025-01-27 [2025-01-29].
- ^ OpenAI称有证据表明DeepSeek利用其模型训练竞争对手. RFI - 法国国际广播电台. 2025-01-29 [2025-01-29] (中文(简体)).