跳转到内容

DeepSeek-V2.5

维基百科,自由的百科全书
Deepseek V2.5
開發者深度求索
首次发布2024年9月15日,​4個月前​(2024-09-15
前任DeepSeek-V2
繼任Deepseek-V3
类型
许可协议MIT
网站www.deepseek.com

DeepSeek-V2.5深度求索于2024年9月15日发布的人工智能大型语言模型,专门适用于通用、编码等任务。在自然語言理解、文本生成、情感分析、知識圖譜構建等方面具有顯著的性能提升。[1]

功能

[编辑]

DeepSeek-V2.5基於深度學習技術。DeepSeek-V2.5在AlpacaEval 2.0中整體準確度為 50.5%,比 DeepSeek-V2-0628 (46.6%) 和 DeepSeek-Coder-V2-0724 (44.5%) 有所提升。在HumanEval Python中DeepSeek-V2.5 得分為 89,反映了其在編碼能力方面的顯著進步。在語言對齊方面,DeepSeek-V2.5在中文評估中優於GPT-4o mini和GPT-4o。但與OpenAI 的GPT-4o mini、Claude 3.5 Sonnet 和OpenAI 的GPT-4o 相比,性能較低。[2]

使用

[编辑]

DeepSeek-V2.5使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。用户可以在DeepSeek官方网站和App使用官方提供的服务。DeepSeek-V2.5上線時提供的 API 服務定價為價格為每 100 萬個代幣 0.14 美元,輸出代幣價格為每 100 萬個代幣 0.28 美元。[3]

DeepSeek-V2.5-1210

[编辑]

DeepSeek-V2.5-1210 是 DeepSeek V2.5 模型的最後一個版本,使用了Post-Training ,發布於2024年12月10日,這版模型優化了文件上傳功能,並且全新支援了聯網搜索。根據MATH-500數據集的評估,模型的數學任務完成率從74.8% 提升至82.8%,而LiveCodebench 的得分也從29.2% 提高到34.38%。此外,內部評估也表明,模型在寫作和推理能力上都有所提升,能夠產生連貫且符合上下文的輸出。[4]

参见

[编辑]

参考资料

[编辑]
  1. ^ DeepSeek V2 系列收官,联网搜索上线官网 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29]. (原始内容存档于2025-01-26) (中文(中国大陆)). 
  2. ^ Franzen, Carl. DeepSeek-V2.5 wins praise as the new, true open source AI model leader. VentureBeat. 2024-09-10 [2025-01-29]. (原始内容存档于2025-01-03) (美国英语). 
  3. ^ DeepSeek-V2.5: A Comprehensive Overview. www.linkedin.com. [2025-01-29] (中文). 
  4. ^ DeepSeek AI 发布新版 DeepSeek-V2.5-1210:数学、编程与写作能力大幅提升. www.aibase.com. [2025-01-29] (中文). 

外部链接

[编辑]