DeepSeek-R1
開發者 | 深度求索 |
---|---|
首次發布 | 2025年1月20日 |
原始碼庫 | |
前任 | DeepSeek-R1-Lite |
類型 | |
許可協議 | MIT |
網站 | www |
DeepSeek-R1是深度求索(DeepSeek)於2025年1月20日發布的人工智慧大型語言模型,專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1[1]。
開發
[編輯]DeepSeek-R1的論文中沒有公布其訓練成本等細節。[2]不過此前的論文中,DeepSeek透露其訓練使用的是英偉達因為美國出口管制而針對中國市場特供的低配版GPU H800,訓練成本為557.6萬美元,遠低於類似西方公司的閉源模型。[1][3][4]外界預估R1的訓練成本也不會比V3高多少,或在600萬美元上下。[5]
使用
[編輯]DeepSeek-R1使用MIT協議開源,意味著任何人都可以自由使用該模型,包括商業用途。用戶可以在DeepSeek官方網站和App使用官方提供的服務。
DeepSeek-R1上線時提供的 API 服務定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元,輸出API價格僅僅只有OpenAI o1的3%。[6]
外界反應
[編輯]1月27日,DeepSeek超越ChatGPT,登頂蘋果App Store美國區免費APP下載排行榜。[7]
DeepSeek-R1爆火,引發全球投資者大量拋售人工智慧相關股票。1月27日,英偉達美股股價下跌近17%,單日市值蒸發5890億美元,為美國股市歷史上最大。[8][9]
DeepSeek-R1發布後不久,Meta執行長馬克·扎克伯格就宣布,Meta計劃在2025年投入超600億美元,加大對人工智慧的投入。[5]據媒體1月27日報道,Meta成立了四個研究小組,專門研究DeepSeek的模型。[10]其中兩個小組研究其開發者如何降低訓練和運行DeepSeek的成本,第三個小組研究訓練模型可能使用了哪些數據,第四個小組研究基於DeepSeek模型屬性重構其LLaMA模型的新技術。[11]
OpenAI表示,其有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的開源模型,這違反了OpenAI的服務條款。[12]
參見
[編輯]參考資料
[編輯]- ^ 1.0 1.1 DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?. 美國之音. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-28) (中文).
- ^ DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 (PDF). [2025-02-01]. (原始內容存檔 (PDF)於2025-01-29).
- ^ DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3 (PDF). [2025-02-01]. (原始內容存檔 (PDF)於2025-02-01).
- ^ 孫銘蔚. 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 澎湃新聞. 2025-01-22 [2025-01-28]. (原始內容存檔於2025-01-26) (中文(中國大陸)).
- ^ 5.0 5.1 吳遇利. DeepSeek“恐惧感”支配硅谷!Meta被曝组建4个小组专门研究. 澎湃新聞. 2025-01-27 [2025-01-29] (中文(中國大陸)).
- ^ 鄭遠方. “价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠. 財聯社. 2025-01-28 [2025-01-28] (中文(中國大陸)).
- ^ 李瀟瀟, 胡含嫣. DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜. 澎湃新聞. 2025-01-27 [2025-01-29]. (原始內容存檔於2025-01-27).
- ^ 日本放送協會. ナスダック大幅下落 中国企業ディープシーク 生成AI開発受け. NHKニュース. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-30) (日語).
- ^ 何浩. 英伟达市值蒸发近6000亿美元,规模创美股史上最大,市值跌至全球第三. 華爾街見聞. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-28) (中文(中國大陸)).
- ^ Meta Scrambles After Chinese AI Equals Its Own, Upending Silicon Valley. The Information. 2024-01-27 [2025-01-29]. (原始內容存檔於2025-01-30) (英語).
- ^ DeepSeek震撼硅谷 Meta组建四个研究小组专门破解. 財聯社. 2025-01-27 [2025-01-29].
- ^ OpenAI称有证据表明DeepSeek利用其模型训练竞争对手. RFI - 法國國際廣播電台. 2025-01-29 [2025-01-29] (中文(簡體)).