百度文心助手都成这样了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
百度文心助手都成这样了
6785点击    2025-10-20 11:43

国庆不放假,国内AI厂商都在干嘛?百度:卷!


这不,刚刚结束的百度AI应用及模型升级发布会上,又双叒叕一大波新功能来袭。


百度文心助手都成这样了


继三个月前百度搜索发布近十年最大改版后,文心助手再次迎来全面升级:


一口气上新8种多模态创作能力,全新生成分钟级长视频,发布行业首个实时互动的数字人智能体……


视频生成模型百度蒸汽机也同时推出最新版本,突破传统模型时长限制,首次实现AI长视频实时交互生成。


百度文心助手都成这样了


可以说,百度这次真的不一样。


根据Omdia《2025年中国AI搜索市场报告》及QuestMobile《2025年8月AI应用行业月度报告》,百度搜索目前已经在AI用户规模、综合技术能力等多个核心指标位列AI搜索全行业第一,其用户日均AIGC生成量也已破千万级


百度文心助手都成这样了


当同行都在卷同质化内容时,百度AI已经交出了自己的破圈打法——AI时代,唯快不破


百度AI能力全面升级


过去,大众对百度搜索的印象还停留在:百度一下,你就知道。


而今天百度搜索提出了新的口号——百度一下,解锁AI万能搭子


百度文心助手都成这样了


AI正在成为百度内部探索搜索引擎能力边界的最强助力。


文心助手拓展AI搜索新形态


据百度搜索相关负责人介绍,百度文心助手相比三个月前的首次发布,更快也更聪明了。


快在搜索速度,移动端和PC端均上线极速大模型,大幅度提高结果生成及任务处理速度,比行业第一梯队大模型的速度快5倍,而成本却只有它的70%


聪明在于它更具人性化,也更全面。


在生活中,文心助手可以随时随地提供精准实时的响应,比如说出去旅游,碰到不熟悉的东西怎么办?直接掏出百度搜索的魔镜功能,就能轻松获取对应知识。


百度文心助手都成这样了


又或者想知道某款药品的注意事项,百度搜索也能一站解决。文心助手已和专业医生资源达成合作,提供全天24小时的AI在线问诊及咨询服务。


百度文心助手都成这样了


文心助手现在也是打工人最强的办公助手,具备超长记忆和深度研究能力,可以快速处理譬如市场分析报告生成在内的复杂任务。


百度文心助手都成这样了


另外,文心助手还搭载有数十亿学习题库,拍一拍作业秒回答,辅导孩子作业so easy~


而且文心助手拥有丰富的AI人设(包括16型MBTI和12星座),基于数据记忆更懂用户习惯,创新玩法让百度搜索从工具属性转型为专属你的AI伙伴。


现在的文心助手也超好玩,支持长视频、图片、音乐等AIGC全模态创作,社区时下最新的爆款AI玩法也都能在上面找到对应模版。


拍照有废片?一键P图更换背景。


百度文心助手都成这样了


还可以生成各类风格写真,表情包、证件照、潮玩手办……应有尽有。


百度文心助手都成这样了


照片太多,朋友圈九宫格放不下,也能转成动态视频。


百度文心助手都成这样了


甚至还可以模仿经典影视剧里的名场面:


百度文心助手都成这样了


百度文心助手目前已上线30多种爆款视频特效,后续还将持续加载ing。这波操作属实是把AI特效的门槛降至最低,以后人人都能像玩滤镜一样玩特效。


视频创作者也有福了,只需一句话,分分钟生成长视频,借助多Agent蜂群工作流技术,编剧Agent、导演Agent、演员Agent、后期Agent各司其职,最终一句指令就能快速搞定“脚本-角色-分镜-成片”全流程。


如果对具体的分镜细节或者人物形象不满意,文心助手也支持视频精调,同时故事仍然能保持连贯自然。


视频配套功能也都通通同步发出,内置超200种配音音色,满足视频声音需求;整合文生/图生图功能,视频封面图也能AI一站式输出,排版精美且提供自主编辑。


百度文心助手都成这样了


《技能五子棋》带起的AI写歌潮流,在百度这也能找到,同样也是一句话就能写出Rap等多种风格的歌曲,还可以上传图片生成对应MV,甚至还可以把自己照片转成数字人歌手。


另外,百度还预计将在10月底上线AI播客功能~


会上,百度搜索还发布了首个可以实时互动的数字人智能体,不仅可以随问随答,真实感拉满,还有各种可以咨询专业意见的心理、法律等数字分身,更深层次的情感互动也不在话下。


百度文心助手都成这样了


小结一下,文心助手就是这样全能,所有你想要做的,它都能帮你实现,将AI创作变成日常生活中最简单不过的一件小事,这就是百度搜索新的目标。


而且以上这些,通通免费开放给所有用户。


“蒸汽机”开启长视频实时交互新纪元


与此同时,百度AI视频生成模型蒸汽机也来到了全新的10.15版本(文心专精版),这也是行业内首次实现AI视频流式生成


百度文心助手都成这样了


过去AI视频生成,要想看到视频效果,必须要等待任务全部处理好才可以,而现在蒸汽机模型可以边推理边修改。


一张图+一个Prompt,就能实时看到视频进程,期间也可以随时喊停、重新填写提示词,将视频生成的主导权从模型重新交还给用户自己,这就是百度蒸汽机眼中的未来创作范例。


生成速度不仅快速而且流畅,视频时长也从传统的5~10秒限制来到“无上限”


还有专属的数字人视频模式,可支持沉浸式互动体验,创建开放世界也变得轻而易举,无论是游戏地图还是景点体验,都能WASD+鼠标任意探索。


百度文心助手都成这样了


而更多技术细节可以详见我们此前的这篇文章《Sora2不够香了!这款国产AI视频模型已经能边看边生成,生成快还互动佳》


百度的AI布局策略:不止于快


从模型端蒸汽机的架构革新到产品端百度搜索的AI转型,百度正在完成AI生态的全面赋能。


百度文心助手都成这样了


面对行业同质化压力,AI技术难以形成长期的技术壁垒,百度商业体系商业研发总经理刘林表示,百度的优势在于两点。


其一,就是执行力,谁能速度更快,谁就能抢先占据市场大头,因此百度的技术迭代相当之快,可能前几天还是版本1.0,过两天就升级到版本1.1,百度整个公司就是在卯足了劲冲AI。


比如说在蒸汽机模型上,这次升级在通用生成能力上和市场上最好的模型其实还有所距离,所以他们目前的改进策略就是先迅速提出补长板,再后续改需求补短板,实现边做边改、快速迭代。


其二,是百度一直强调的结合业务、客户、创作者去共同构建起稳定的供给关系,把AI做穿。


百度副总裁及移动生态商业体系负责人陈一凡进一步补充道,百度当前做AI产品的思路就是既面向toB,又面向toC


这里的B指的是百度内部的B,即百家号、百度文库等,围绕百度丰富的产品矩阵和数据资源建立起一整个AI生态,toC就是面向第三方需求,建立合作圈层,即了解用户真实需求,将玩法做到更丰富更多样。


百度文心助手都成这样了


另外,在提供给用户的toc端产品定价上,百度在年初大规模降价后,目前依旧保持的是加量不加价的性价比路线,让AI低门槛,也是百度的AI用户规模能够迅速增长至行业第一梯队的优势所在。


后续百度也将就其生态完成精准的toB、toC细化,简单来说,该有的百度都会有,别人没有的百度也将会有。


而这就是百度AI的下一步。


文章来自于“量子位”,作者“鹭羽”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

7
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales