因为大家太过热情, Gemini 2.5提前重磅更新——
史上最强编码模型Gemini 2.5 Pro Preview的I/O版。
只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。
其他游戏、对象模拟等等也都可以通过一句提示完全搞定。
它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本领域、视觉以及WebDev Arena排行榜。
为此,这也是有史以来单一模型首次横扫文本、视觉和WebDev领域!
网友们表示,好家伙,不用买Cursor了。
此次更新的重点就在于编码能力,包括不限于改进前端和UI开发,以及基础编码任务(例如代码转换和编辑,以及创建复杂的代理工作流)。
以前端web开发来说,它目前在WebDev Arena排行榜上位列第一。这个排行榜专门用来衡量人类对模型构建美观且功能强大的Web应用能力的偏好。
与之前版本相比,相当于上涨了147分。Demis Hassabis表示:no big deal。(doge)
目前像Cursor背后公司、Cognition和Replit等都使用了该模型。
具体来看看各种实际场景中的应用。
基于模型的视频理解能力,它可以从单个 YouTube 视频创建交互式学习应用。
就像这样~跟之前模型版本相比,用户界面也更加完善。
它在VideoMME 上获得了84.8% 的得分。
实现新功能意味着需要手动深入设计文件,检查组件以匹配颜色、字体、内边距、外边距和边框等样式属性,然后手动编写所需的 CSS 代码来准确复制这些视觉属性。
但现在只需一句提示词,就可以复刻风格,比如添加一个windows 95风格的视频播放器。
除此之外,它还增加了一些新功能,比如听写入门应用,只需说出你的想法,Gemini就能将创意变为现实。
目前,开发者可以通过Google AI Studio和Vertex AI在 Gemini API 中使用更新的 Gemini 2.5 Pro 开始构建。Gemini App的用户也可以使用它。
在官方博客中,他们还表示:这个版本原计划在几周后的Google I/O大会上发布,但由于Gemini 2.5太受欢迎,于是决定现在发。
这是基于 Gemini 2.5 Pro编码和多模态推理功能所获得的广泛好评而做出的改进。
有一说一,Gemini 2.5这一系列确实受到不少关注。
就在前几天,Gemini 2.5 Pro在直播中通关了《宝可梦蓝》,成为首个大模型宝可梦联盟冠军,直接打破了此前Claude的记录。
此次新版本一出,有网友给出了高度评价:Gemini取代Gemini是一个信号,表明有些事情已经发生了变化。
谷歌在各个方面都在稳步发展。头把交椅仍会易主,但巨龙已经苏醒了。
那么,问题来了,既然模型新版本这么强大,为啥谷歌不更新版本号呢?(手动狗头)
参考链接:
[1]https://x.com/GoogleDeepMind/status/1919770265711419826
[2]https://x.com/lmarena_ai/status/1919774743038984449
[3]https://x.com/AndrewCurran_/status/1919813547212865770
[4]https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
文章来自于“量子位”,作者“白交”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales