Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会
6584点击    2025-11-21 10:54

谷歌乘胜追击!Gemini 3 Pro好评如潮没两天,最强文生图模型Nano Banana也推出Pro版本


自推出以来还未被任何人追赶上,谷歌自己就给他升级了,真是不让其他家喘口气。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


这次不仅仅是提升图像生成质量。


这次Nano Banana Pro又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。


比如生成一张自行车维修保养注意事项海报。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


招牌技能多个图片混合,这次最多支持14张输入图片,全都能保持一致性,多个人物角色和复杂场景也不惧。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


此外还在Nano Banana基础上强化了文本渲染,结合多模态理解能力,可以直接把图片中的英文文字翻译成韩文、中文或其他语言,同时保持原有的设计风格不变。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


谷歌这番操作秀翻全网:


Nano Banana Pro让人感觉AI图像创作一夜间迈入了新阶段。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


从创意到生产的完整工作流


Nano Banana Pro最引人注目的技术进步体现在几个方面。


首先是文字渲染能力的大幅提升,不仅能在图像中准确生成清晰可读的文字、艺术字,还支持多种语言的直接渲染。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


营销团队可以用它快速设计生成营销素材,实现创意快速迭代:


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


这项功能的背后是Gemini 3 Pro的强大推理能力。模型不仅理解图像内容,还能理解文字的语义上下文,这让它能够在保持原始艺术风格和布局的同时,准确地进行语言转换。


另一个重大突破是模型与Google Search的深度集成。


这不是简单的搜索功能,而是让模型能够基于谷歌搜索庞大知识库、实时信息生成准确的图表、地图和信息图。


比如你要制作一份关于印度奶茶的食谱图解,模型不仅能生成美观的步骤图,还能确保配料比例和制作步骤的准确性。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


还可以升级美化原本简约的PPT页面,就像这款小沙发椅,从原料、生产到运输的全流程,它可以自动在地图上清晰标示说明:


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


Gemini 3高级推理加持下,生成的针对性强、专业的信息图,可以帮助用户快速将复杂知识可视化。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


比如创建一个胰岛素-葡萄糖反馈回路的解释图。


最终生成结果遵循提示词用箭头显示胰腺(β/α细胞)、肝脏与血液之间的通信方向,清楚标注了高葡萄糖和低葡萄糖状态:


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


创建一张关于生态系统中营养级和能量转移的详细信息图,它直接生成了标注着生产者、初级消费者、次级消费者和三级消费者的金字塔,包含10%能量转移规则的说明,配有生态系统场景插图:


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


在分辨率和格式支持上,Nano Banana Pro支持2K、4K高清分辨率,能满足专业制作的要求;支持多种宽高比,从社交媒体的方形图片到电影级的2.76:1超宽画幅都能轻松应对。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


另外,它还支持自由调整图像的光线、镜头、对焦、色彩调校等物理属性和构图:


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


比如通过光线和明暗对比重塑画面的视觉逻辑,嗯,这感觉确实不一样了:


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


指定角色,它还可以快速生成符合某个主题的定制化图片。


例如以雪人为核心角色,聚焦“节日庆祝”主题,在输入框中输入“snowman celebrating the holidays doing a variety of festive activities”(雪人庆祝节日,进行各种节日活动)。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


紧接着这个雪人就会出现在滑雪缆车、雪地雪橇、宽扎节布置、厨房烤饼干、烛光晚餐等不同场景中。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


工作流整合Veo 3视频生成模型,还可以一键用刚生成的图当关键帧继续生成视频。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


全面铺开:从开发者到普通用户都能用上


谷歌这次的发布策略相当全面,覆盖了从开发者到普通用户的各个层面。


对于普通用户,模型将、通过多个渠道提供。在Gemini应用中选择“创建图像”功能时就能使用,免费用户有限额配额,超出后会回退到原始的Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户则享有更高的配额。


对于开发者,Nano Banana Pro已经通过Gemini API在Google AI Studio和Vertex AI中提供。企业级用户可以享受到预配置吞吐量、按需付费以及高级安全过滤器等功能。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


谷歌还在新的AI开发平台Google Antigravity中集成了这项技术,让编码代理能够直接利用图像生成功能来生成详细的UI模型或新的视觉资产。


第三方设计工具如Adobe Photoshop和Figma也会集成Nano Banana Pro。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


最后,谷歌宣布在Gemini app中推出AI图像验证功能,依托其2023年推出的SynthID数字水印技术(给AI生成的内容加一层“隐形水印”)。


用户可通过上传图像并提问“这是AI生成的吗?”,确认其是否由谷歌AI生成或编辑。


Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不给竞争对手喘息机会


官方表示未来这个功能还将扩展至视频、音频等更多格式及搜索等更多平台。


与此同时,即日起Gemini app、Vertex AI、Google Ads、Flow中的Nano Banana Pro生成图像中将被嵌入C2PA元数据。


换句话说,在这些平台上用Nano Banana Pro做出来的图片,都会自带能查来源和创作信息的专属“数字档案”。


官方Blog:https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=


参考链接:

[1]https://x.com/GoogleDeepMind/status/1991522595129139486


文章来自于“量子位”,作者 “梦晨 西风”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0