DeepSeek-R2大模型发布,性能超越GPT-4

作者:

中国人工智能公司深度求索正式发布全新一代大模型DeepSeek-R2,该模型在多项基准测试中表现优异,推理能力大幅提升,尤其在数学、编程领域超越GPT-4。DeepSeek-R2采用混合专家架构,参数规模达到1.8万亿,但推理成本降低80%。业内专家认为,这标志着中国AI技术进入新阶段。目前该模型已开放API接口,开发者可申请试用。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注