中国人工智能公司深度求索(DeepSeek)近日正式发布其最新一代大语言模型DeepSeek-R1,该模型在数学推理、代码生成和复杂逻辑问答等多个基准测试中超过GPT-4,引起全球科技界广泛关注。DeepSeek-R1采用创新的混合专家架构与强化学习技术,训练成本仅为同类模型的三分之一,却实现了更优性能。目前该模型已开放免费API接口,开发者可在官网体验。业内分析认为,这标志着中国AI大模型在开源生态和成本效率上实现重大突破,将改变全球AI竞争格局。
中国人工智能公司深度求索(DeepSeek)近日正式发布其最新一代大语言模型DeepSeek-R1,该模型在数学推理、代码生成和复杂逻辑问答等多个基准测试中超过GPT-4,引起全球科技界广泛关注。DeepSeek-R1采用创新的混合专家架构与强化学习技术,训练成本仅为同类模型的三分之一,却实现了更优性能。目前该模型已开放免费API接口,开发者可在官网体验。业内分析认为,这标志着中国AI大模型在开源生态和成本效率上实现重大突破,将改变全球AI竞争格局。
发表回复