中国首款国产开源大模型DeepSeek-V3发布,性能超越GPT-4

作者:

近日,中国人工智能公司深度求索(DeepSeek)正式发布其新一代大语言模型DeepSeek-V3。该模型在多项基准测试中表现出色,部分指标超越OpenAI的GPT-4,引发全球关注。DeepSeek-V3采用MoE架构,训练成本仅约558万美元,远低于同类模型。其开源特性将推动国内AI生态发展,降低企业应用门槛。专家表示,这标志着中国在AI大模型领域迈入国际第一梯队。

来源:澎湃新闻 原文链接

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注