Deepseek | 半式导航

专注于开发先进的大语言模型（LLM）和相关技术。在其发展历程中，DeepSeek发布了多个重要模型，包括DeepSeek LLM、DeepSeek-Coder、DeepSeekMath、DeepSeek-VL、DeepSeek-V2、DeepSeek-Coder-V2，以及DeepSeek V2.5等1。

特别值得一提的是DeepSeek-V3模型，这是DeepSeek于2024年12月26日正式上线并同步开源的全新系列模型。DeepSeek-V3是一个拥有6710亿参数的大型混合专家（MoE）模型，其中激活参数为370亿。该模型在14.8万亿个token上进行了预训练，并在性能上与GPT-4o和Claude-3.5-Sonnet等世界顶尖闭源模型相媲美。DeepSeek-V3在知识、长文本、代码、数学和中文等方面都取得了显著的进步，尤其在算法代码和数学方面表现突出，生成速度提升至60 TPS，相比V2.5提升了3倍