深度求索
外观
深度求索 | |
---|---|
DeepSeek | |
原文名称 | 杭州深度求索人工智能基础技术研究有限公司 |
公司類型 | 私人公司 |
成立 | 2023年5月 |
創辦人 | |
總部 | 中國浙江省杭州市 |
产业 | 信息技术 |
所有權者 | 幻方量化 |
网站 | deepseek.com |
深度求索(全称杭州深度求索人工智能基础技术研究有限公司,英文简称DeepSeek)是中国人工智能以及大型语言模型公司,其创始人和CEO为梁文锋。
沿革
[编辑]DeepSeek成立于2023年7月,由中国对冲基金幻方量化创立,其创始人和CEO为梁文锋,公司的总部位于中國浙江省杭州市,公司专注于AI大模型的研究和开发[1]。
2024年5月,DeepSeek发布并开源[2]了旗下MoE大模型DeepSeek-V2,因其模型架构与经济性而脱颖而出,DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4 Turbo的百分之一[1][3]。
2024年12月,DeepSeek发布并开源[4]了DeepSeek-V3,DeepSeek表示该大模型的训练系基于2,048块英伟达H800型GPU(针对中国市场的低配版GPU)集群上运行55天完成,训练耗资557.6万美元[5];DeepSeek-V3的评测成绩超越Qwen2.5-72B(阿里自研大模型)和Llama 3.1-405B(Meta自研大模型)等开源模型,能与GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等闭源模型相抗衡[1]。
2025年1月20日, DeepSeek发布并开源[6]了DeepSeek-R1模型,该模型在数学、代码、自然语言推理等任务上,性能超越OpenAI o1正式版[1]。
参考文献
[编辑]- ^ 1.0 1.1 1.2 1.3 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 新浪财经. 2025-01-22 [2025-01-22] (中文).
- ^ DeepSeek. DeepSeek-V2: A Strong, Economical, 和 Efficient Mixture-of-Experts Language Model. github. 2024-05-06.
- ^ 大模型价格又砍一刀 这次“屠夫”竟是量化私募?. 财联社. 2024-05-10 [2025-01-22] (中文).
- ^ DeepSeek. DeepSeek-V3. github.
- ^ DeepSeek. DeepSeek-V3 Technical Report (PDF). github. 2024-12-26 [2025-01-24] (英语).
- ^ DeepSeek-R1. github. 2025-01-20 [2025-01-24] (英语).