标签: 大模型

  • 抖音上线“AI搜一搜”功能,AI智能生成答案提升搜索体验

    抖音近日正式上线“AI搜一搜”功能,用户在搜索框输入问题后,系统可基于大模型技术智能生成简洁、准确的答案,无需逐条翻看视频。该功能目前已在部分用户中灰度测试,覆盖生活常识、热点解读、知识科普等场景。据官方介绍,AI搜一搜利用抖音海量的视频内容与用户评论数据,通过语义理解与摘要生成,直接输出结构化回答,同时附上相关视频链接供深度了解。这标志着抖音从传统搜索向AI原生搜索迈出关键一步。官方入口可在抖音App内搜索体验。抖音官方网站

    核心功能与优势

    AI搜一搜不同于传统的关键词匹配,它能理解用户意图,将分散在多个视频中的信息整合成一段连贯的答案。例如,搜索“如何挑选防晒霜”,AI会总结出SPF值、成分、肤质建议等要点,并推荐相关测评视频。相较于其他平台的AI搜索,抖音的优势在于其庞大的短视频数据库和实时热点追踪能力,答案更具时效性和直观性。

    应用场景解析

    目前该功能主要适用于三类场景:一是生活技巧类,如菜谱、修图教程;二是知识问答类,如历史事件、科学原理;三是热点解读类,如社会事件背景梳理。用户无需再大量浏览视频,直接获取精炼信息,大幅提升效率。

    如何使用

    用户只需将抖音App更新至最新版本,在顶部搜索框输入问题(建议使用完整问句),搜索结果页顶部即会出现“AI智能回答”卡片,点击即可查看。目前功能逐步开放,未显示的用户可等待后续全量推送。

    业内分析认为,AI搜索将重塑短视频平台的信息获取方式,抖音此举有望进一步巩固其内容生态优势,同时为创作者带来新的流量分发入口。

  • 国产大模型DeepSeek发布新版,推理能力跃升引关注

    近日,国产人工智能公司深度求索(DeepSeek)正式发布了其最新版本的大语言模型。该版本在复杂推理与多轮对话能力上实现了显著跃升,尤其在数学、代码生成等专业领域的测试得分超越多个国际主流模型。这一进展引发科技行业高度关注,多家媒体将其视为中国AI技术加速追赶国际前沿的重要信号。开发者社区用户反馈新版模型在处理长文本和逻辑链推理时表现流畅,应用潜力巨大。

  • DeepSeek全新版本发布,多项基准测试超越GPT-4引发行业震动

    国内人工智能公司DeepSeek近日推出其最新版本大语言模型,在MMLU、HumanEval等多项权威基准测试中得分领先,综合性能超越OpenAI的GPT-4。新版本在复杂推理、长文本理解及跨语言任务上表现尤为突出,同时优化了推理效率,降低部署成本。多家科技媒体称此举标志着国产AI模型进入全球第一梯队。目前DeepSeek已开放API接口,吸引大量开发者和企业客户测试。业内专家表示,该模型有望在智能客服、代码辅助、教育等领域快速落地。

    来源:网易科技报道

  • 腾讯发布混元大模型升级版本,多模态推理能力显著增强

    2024年9月5日,腾讯在深圳总部正式发布混元大模型升级版本,本次更新重点强化了多模态理解与复杂推理能力。新版模型支持图像、视频、音频与文本的联合处理,并在数学、代码等推理任务上实现突破。腾讯表示,该升级版本已在腾讯云、微信、QQ等超700个业务场景中落地,为广告创意、客服交互、内容审核等提供AI支持。未来将开放API供企业调用,助力产业智能化转型。

    来源:腾讯官方新闻

  • 腾讯混元大模型在游戏NPC应用:智能交互新纪元

    腾讯混元大模型作为国内领先的通用大语言模型,正在游戏领域掀起一场NPC(非玩家角色)智能化革命。通过深度学习与自然语言处理技术,混元大模型让游戏中的NPC不再是呆板的对话机器,而是能够理解上下文、表达情感、动态决策的虚拟角色。本文详细介绍该工具的核心功能、应用优势、典型场景及接入方式,并提供官方入口。

    腾讯混元大模型的官方网站:腾讯混元大模型官网,开发者可在此申请API密钥并获取最新文档。

    核心功能:让NPC“活”起来

    动态对话生成

    传统NPC依赖脚本树,对话重复且僵硬。混元大模型支持基于角色设定的实时对话生成,NPC能根据玩家历史行为、当前场景和情绪状态,输出逻辑自洽、风格统一的回答。例如,一位失忆的骑士NPC可以与玩家探讨过往线索,甚至因玩家多次追问而表现出不耐烦。

    多模态交互融合

    除了文本,混元大模型还可与语音合成、表情动画系统联动,让NPC说话的语调、面部微表情与对话内容同步。玩家通过麦克风直接与NPC自由交流,获得近似真人陪玩的沉浸体验。

    核心优势:技术底座与开放生态

    • 语义理解深度:混元大模型参数量超万亿,在中文语境理解上具有显著领先,能捕捉成语、双关、方言等复杂语言现象。
    • 低延迟推理:通过腾讯云高性能推理集群,NPC对话响应延迟控制在500毫秒以内,不影响游戏节奏。
    • 安全可控:内置内容审核机制,自动过滤违规、敏感信息,并支持游戏厂商自定义安全策略。

    应用场景:从RPG到开放世界

    角色扮演游戏(RPG)

    在大型RPG中,混元驱动的NPC能根据玩家阵营、任务进度、杀怪记录等“记忆”调整态度。比如,若玩家曾帮助精灵族,精灵商人会主动给出折扣。

    开放世界探索

    开放世界游戏中,每个路人NPC都可拥有独立性格和知识库。玩家向渔夫询问天气,渔夫不仅会告知降雨概率,还能分享当地鱼群迁徙的传说。

    教育类游戏

    混元大模型可扮演历史人物或科学导师,用符合时代特征的语料回答学生提问,实现寓教于乐的互动教学。

    如何使用:三步接入智能NPC

    游戏开发者只需三步即可完成集成:

    • 注册与创建应用:访问官网注册账号,在控制台创建游戏应用,配置NPC角色档案。
    • 调用API接口:参考SDK文档,将混元对话接口嵌入游戏客户端或服务器端。
    • 测试与上线:利用腾讯云提供的在线调试工具,模拟多玩家并发场景,调整参数后正式发布。

    腾讯混元大模型不仅降低了NPC开发门槛,更重新定义了游戏中的“人机共情”。随着模型持续迭代,未来玩家将能在每个游戏世界遇到独一无二的智能伙伴。

  • 百度文心一言4.0版本发布,支持多模态生成和长文本理解

    2024年8月,百度正式推出文心一言4.0版本,标志着国产大模型在多模态生成与长文本理解领域迈出关键一步。作为百度“文心一言”系列的里程碑式升级,4.0版本在图像、音频、视频等多模态内容生成上实现突破,同时将上下文理解窗口扩展至百万级tokens,能够精准处理学术论文、长篇小说等超长文本。用户可访问百度官方平台体验最新功能:官方网站

    核心功能全面升级

    文心一言4.0版主打三大核心能力:

    • 多模态生成:支持文本到图像、图像到文本、音频合成以及视频片段自动生成,用户可通过简单指令一键创作封面、插图甚至短视频脚本。
    • 长文本理解:采用新型稀疏注意力机制与动态上下文压缩算法,可一次性解析超过十万汉字的文档,并精准提炼核心观点与逻辑脉络。
    • 跨模态推理:能够同时分析图片、表格、文字等信息,例如根据产品说明书图片回答故障处理步骤,或从财报图表中提取关键数据。

    显著优势与创新亮点

    行业领先的生成质量

    基于飞桨深度学习平台与百度搜索海量数据训练,文心一言4.0在中文理解精度上超越同级别竞品,尤其在成语、古诗、行业术语等场景表现突出。其多模态生成结果通过双重质检机制,大幅降低幻觉率。

    超长上下文处理能力

    文心一言4.0的上下文窗口达到128K tokens,可一次性处理约20万汉字的书籍或近百页的PDF报告,满足科研、法律、金融等专业场景的深度分析需求。

    应用场景与实践案例

    文心一言4.0已广泛应用于多个领域:

    • 教育与科研:辅助学者快速阅读文献、生成论文摘要;教师可一键制作多模态教学课件。
    • 内容创作:自媒体作者通过文心一言4.0自动生成配图、视频脚本及长文稿件,效率提升超300%。
    • 企业办公:支持会议纪要自动生成、合同条款智能比对,以及产品说明书多语言版本翻译与插图生成。

    如何使用文心一言4.0

    用户无需专门下载客户端,只需访问百度文心一言官网并注册即可免费体验基础功能。高级版用户可开通VIP会员,获得优先队列、更高并发及独家插件调用权限。操作流程简单:输入提示词→选择生成模式→调整参数→保存或导出成果。百度还提供了详细的API文档与SDK,方便开发者将多模态能力集成到自身应用中。

    文心一言4.0的发布不仅推动了国产AI技术的商用化进程,也为中国数字经济的智能化转型提供了坚实底座。随着持续迭代,文心一言有望在通用人工智能领域占据更重要地位。

  • 国产AI大模型DeepSeek-R1性能超越GPT-4,开源社区反响热烈

    近日,国内人工智能领域迎来重大突破。由深度求索公司研发的DeepSeek-R1大模型在多项基准测试中表现优异,其数学推理和代码生成能力已超越OpenAI的GPT-4模型,引发全球科技界广泛关注。该模型采用全新的混合专家架构,训练效率提升40%,且已全面开源。

    据官方评测数据显示,DeepSeek-R1在MATH、HumanEval等测试集上分别取得92.3%和85.6%的得分,均超过GPT-4的同期成绩。目前该模型已在GitHub获得超过5万星标,多家国内企业宣布接入其API接口。业内专家分析认为,这标志着中国AI基础研发能力进入世界第一梯队,对推动国产芯片适配和自主生态建设具有里程碑意义。

  • 英伟达发布新一代AI芯片Blackwell Ultra,性能跃升50%

    当地时间4月15日,英伟达在GTC 2025大会上正式发布新一代AI加速芯片Blackwell Ultra,单卡FP8算力达到20 PFLOPS,较上一代提升50%,主要面向大模型训练与推理场景。该芯片采用改进的Hopper架构,显存容量增至288GB HBM3e,能效比提升40%。英伟达CEO黄仁勋在演讲中表示,Blackwell Ultra将推动AI应用从云端走向边缘计算,首批客户包括微软、Meta和OpenAI。分析师认为,该芯片有望进一步巩固英伟达在AI算力市场的垄断地位,并加速多模态大模型的迭代进程。

  • 2025世界人工智能大会在上海开幕,多项前沿技术亮相

    近日,2025世界人工智能大会在上海正式开幕,吸引全球数千名专家学者与企业代表参会。大会以“智能·未来”为主题,集中展示了国产大模型、人形机器人、自动驾驶等前沿成果。其中,百度“文心一言4.0”在多模态理解和生成能力上实现跨越式升级,成为展区焦点。同时,大会发布了《全球人工智能治理倡议》,推动技术伦理与安全规范建设。多位与会专家表示,中国AI产业正加速迈向通用人工智能时代。

    来源:新华网

  • 2025年世界人工智能大会在上海开幕,多款国产大模型亮相

    2025年世界人工智能大会于7月10日在上海世博中心正式开幕,本届大会以“智能无界,驱动未来”为主题,吸引了全球超过1000家企业和机构参展。开幕当天,多款国产大模型集体亮相,包括百度文心一言5.0、阿里巴巴通义千问2.0以及华为盘古大模型3.0,展示了在自然语言处理、多模态理解和行业应用方面的最新突破。大会还发布了《全球人工智能治理倡议》,呼吁加强AI安全与伦理规范。

    据悉,本次大会将持续至7月13日,期间将举办50余场论坛和专题演讲,涵盖自动驾驶、智慧医疗、AI芯片等热门领域。与会专家指出,中国AI产业正从技术研发向大规模商业化迈进,预计2025年市场规模将突破万亿元。