中国人工智能初创公司DeepSeek今日宣布推出新一代混合专家模型(MoE)架构,在保持千亿参数规模的同时,将推理计算成本降低90%。该架构通过动态路由算法和稀疏激活技术,显著提升模型在复杂推理任务中的效率。据官方测试,在数学竞赛、代码生成等基准上,新模型性能超越同等参数量的GPT-4。这一突破有望加速AI应用在中小企业的普及,推动国产大模型生态的快速发展。
目前该模型已开放API公测,开发者可访问DeepSeek官方平台申请试用。
中国人工智能初创公司DeepSeek今日宣布推出新一代混合专家模型(MoE)架构,在保持千亿参数规模的同时,将推理计算成本降低90%。该架构通过动态路由算法和稀疏激活技术,显著提升模型在复杂推理任务中的效率。据官方测试,在数学竞赛、代码生成等基准上,新模型性能超越同等参数量的GPT-4。这一突破有望加速AI应用在中小企业的普及,推动国产大模型生态的快速发展。
目前该模型已开放API公测,开发者可访问DeepSeek官方平台申请试用。