据多家科技媒体最新报道,国内人工智能初创公司DeepSeek于近日正式发布了其新一代开源大语言模型DeepSeek-R1。该模型在多项基准测试中表现出色,尤其在数学推理和代码生成任务上超越了OpenAI的GPT-4,引发全球AI行业广泛关注。DeepSeek-R1采用混合专家架构,训练成本仅为同类闭源模型的十分之一,但推理效率提升显著。业界分析认为,这一突破标志着开源AI生态正加速追赶闭源巨头,有望推动AI应用进一步普及。目前该模型已在Hugging Face平台开放权重下载,开发者可免费商用。
来自量子位的报道指出,DeepSeek-R1的低成本高性能特性,可能改变当前AI产业的竞争格局,尤其对中小企业部署AI应用具有重大意义。与此同时,该模型的中文理解能力也受到国内用户的认可,在古诗词创作、长文本分析等场景中表现优异。不过,也有专家提醒需关注模型的安全性和偏见问题。
发表回复