国产大模型DeepSeek推出新一代推理模型,性能比肩GPT-4o

作者:

国产AI领域再传重磅消息。近日,深度求索公司正式发布其新一代推理模型DeepSeek-R2,该模型在数学推理、代码生成和长文本理解等多项基准测试中表现优异,部分指标甚至超越OpenAI的GPT-4o。据悉,DeepSeek-R2采用了混合专家架构和强化学习技术,训练成本仅为同类模型的十分之一,却实现了同等甚至更优的性能。目前该模型已开放API内测,企业用户可申请体验。业内分析认为,这标志着中国大模型在底层技术能力上进入全球第一梯队,将加速金融、医疗、教育等行业的智能化转型。同时,DeepSeek宣布开源部分模型权重,推动全球AI生态共建。

来源:36氪

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注