近日,国产人工智能公司深度求索(DeepSeek)正式发布其最新一代推理模型DeepSeek-R2。该模型在数学推理、代码生成和多语言理解等核心任务上取得显著突破,多项评测指标达到或超越国际主流模型如GPT-4o和Claude 3.5。DeepSeek-R2采用创新的混合专家架构和强化学习训练方法,在保持低推理成本的同时大幅提升复杂问题求解能力。目前该模型已开放API接口,开发者可快速接入。业内认为,这一进展标志着中国在基础大模型领域的自主创新能力再上台阶,有望推动AI在金融、医疗、教育等行业的落地应用。
发表回复