中科院发布“紫东太初”多模态大模型2.0版本

作者：

在

中国科学院自动化研究所近日正式发布“紫东太初”多模态大模型2.0版本，这是继1.0版本后中国在通用人工智能领域的又一重大突破。该模型实现了图像、文本、语音、视频、3D点云等全模态信息的统一理解与生成，标志着国产大模型从“多模态融合”迈向“全模态认知”的新阶段。官方项目网站：官方网站

核心功能与技术优势

紫东太初2.0的核心创新在于其“全模态认知推理引擎”。相比前代，模型参数量提升至千亿级别，并采用新型稀疏注意力机制，显著降低了计算成本。其优势体现在：

该模型的发布将直接推动多个行业的智能化转型：

通过融合医学影像、病历文本和语音问诊记录，辅助医生进行多模态疾病诊断，准确率提升15%以上。

在工业质检场景中，模型可同时分析产品外观图像、设备运行声音和传感器数据，实现故障预警与质量检测。

支持虚拟教师与学生进行语音、表情、手势的多模态互动，提供个性化学习方案。

目前，紫东太初2.0已通过中科院自动化所开放平台提供API接口。开发者可通过申请获得模型调用权限。使用流程包括：

此外，团队计划在2024年开源部分预训练模型与工具链，进一步降低使用门槛。