专注于开发先进的大语言模型(LLM)和相关技术。在其发展历程中,DeepSeek发布了多个重要模型,包括DeepSeek LLM、DeepSeek-Coder、DeepSeekMath、DeepSeek-VL、DeepSeek-V2、DeepSeek-Coder-V2,以及DeepSeek V2.5等1。
特别值得一提的是DeepSeek-V3模型,这是DeepSeek于2024年12月26日正式上线并同步开源的全新系列模型。DeepSeek-V3是一个拥有6710亿参数的大型混合专家(MoE)模型,其中激活参数为370亿。该模型在14.8万亿个token上进行了预训练,并在性能上与GPT-4o和Claude-3.5-Sonnet等世界顶尖闭源模型相媲美。DeepSeek-V3在知识、长文本、代码、数学和中文等方面都取得了显著的进步,尤其在算法代码和数学方面表现突出,生成速度提升至60 TPS,相比V2.5提升了3倍
数据统计
相关导航
暂无评论...