跳转到内容

深度求索

维基百科,自由的百科全书
深度求索
DeepSeek
原文名称杭州深度求索人工智能基础技术研究有限公司
公司類型私人公司
成立2023年5月,​19個月前​(2023-05
創辦人
總部中國浙江省杭州市
产业信息技术
所有權者幻方量化
网站deepseek.com

深度求索(全称杭州深度求索人工智能基础技术研究有限公司,英文简称DeepSeek)是中国人工智能以及大型语言模型公司,其创始人和CEO为梁文锋

沿革

[编辑]

DeepSeek成立于2023年7月,由中国对冲基金幻方量化创立,其创始人和CEO为梁文锋,公司的总部位于中國浙江省杭州市,公司专注于AI大模型的研究和开发[1]

2024年5月,DeepSeek发布并开源[2]了旗下MoE大模型DeepSeek-V2,因其模型架构与经济性而脱颖而出,DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4 Turbo的百分之一[1][3]

2024年12月,DeepSeek发布并开源[4]DeepSeek-V3,DeepSeek表示该大模型的训练系基于2,048块英伟达H800型GPU(针对中国市场的低配版GPU)集群上运行55天完成,训练耗资557.6万美元[5];DeepSeek-V3的评测成绩超越Qwen2.5-72B阿里自研大模型)和Llama 3.1-405BMeta自研大模型)等开源模型,能与GPT-4oClaude 3.5-SonnetAnthropic自研大模型)等闭源模型相抗衡[1]

2025年1月20日, DeepSeek发布并开源[6]DeepSeek-R1模型,该模型在数学、代码、自然语言推理等任务上,性能超越OpenAI o1正式版[1]

参考文献

[编辑]
  1. ^ 1.0 1.1 1.2 1.3 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 新浪财经. 2025-01-22 [2025-01-22] (中文). 
  2. ^ DeepSeek. DeepSeek-V2: A Strong, Economical, 和 Efficient Mixture-of-Experts Language Model. github. 2024-05-06. 
  3. ^ 大模型价格又砍一刀 这次“屠夫”竟是量化私募?. 财联社. 2024-05-10 [2025-01-22] (中文). 
  4. ^ DeepSeek. DeepSeek-V3. github. 
  5. ^ DeepSeek. DeepSeek-V3 Technical Report (PDF). github. 2024-12-26 [2025-01-24] (英语). 
  6. ^ DeepSeek-R1. github. 2025-01-20 [2025-01-24] (英语). 

外部链接

[编辑]