AI资讯新闻榜单内容搜索-Gemini

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Gemini
500行极简开源框架,硬刚GPT/Gemini视觉极限!

500行极简开源框架,硬刚GPT/Gemini视觉极限!

500行极简开源框架,硬刚GPT/Gemini视觉极限!

多模态模型代码写得像老司机,却在数手指、量柱子时频频翻车?UniPat AI用五百行代码打造的SWE-Vision,让模型「掏出Python尺子」自我验证,一举拿下五大视觉相关基准SOTA。

来自主题: AI资讯
7652 点击    2026-03-16 15:08
从多模态大模型中「拆」出音频向量模型

从多模态大模型中「拆」出音频向量模型

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2,他们第一个原生多模态向量模型。文本、图像、视频、音频、文档,全部映射到同一个 3072 维向量空间。这是 Omni Embedding(全模态向量模型)的大趋势:一个架构吃下所有模态,从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5,大家都在往这个方向收敛。

来自主题: AI技术研报
5171 点击    2026-03-16 15:06
“牛油果”又鸽了!Meta高管转向考虑谷歌Gemini方案!网友:年砸千亿美刀,性能甚至追不上GLM!曝扎克伯格心态早已转变

“牛油果”又鸽了!Meta高管转向考虑谷歌Gemini方案!网友:年砸千亿美刀,性能甚至追不上GLM!曝扎克伯格心态早已转变

“牛油果”又鸽了!Meta高管转向考虑谷歌Gemini方案!网友:年砸千亿美刀,性能甚至追不上GLM!曝扎克伯格心态早已转变

3月12日(周四),《纽约时报》发布了最新进展:“牛油果”(Avocado)模型确定再次推迟发布。据知情人士透露,Meta 继续开发数月的全新“前沿级”AI 模型,在推理、编程和写作的内部测试中,表现不及 Google、OpenAI 和 Anthropic 等竞争对手的领先模型。

来自主题: AI资讯
8330 点击    2026-03-14 11:08
Z Waves丨中科大天才、林俊旸潜在接班人、Gemini 3 核心推手,通义千问迎来「周浩时刻」

Z Waves丨中科大天才、林俊旸潜在接班人、Gemini 3 核心推手,通义千问迎来「周浩时刻」

Z Waves丨中科大天才、林俊旸潜在接班人、Gemini 3 核心推手,通义千问迎来「周浩时刻」

在大模型狂飙突进的叙事里,算力是入场券,而那些曾亲手拆解过全球顶级模型“黑盒”、并见证其从阵痛到翻盘的核心人才,才是真正的胜负手。

来自主题: AI资讯
9015 点击    2026-03-13 10:51
谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA

谷歌发布首个原生全模态 Embedding 模型 Gemini Embedding 2!它将文本、图、音视频及 PDF 无损融于统一向量空间,实现跨越五大模态的直接检索。这极大降低了架构成本,赋予了 AI 真正连贯的「记忆」,是重塑 AI 基建的里程碑。

来自主题: AI资讯
8957 点击    2026-03-12 10:21
连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

连Gemini都直呼“着迷”的木马,如果你的龙虾token耗太快,是该注意「Clawdrain攻击」了

想象您是一名渗透测试工程师,面前是前几天宣布完成安全升级的OpenClaw 3.8。您不需要去找RCE(远程代码执行),也不用费劲构造缓冲区溢出。您只需要回想一下,近期在网上发生过的两场OpeClaw“闹剧”。第一次Meta AI的对齐总监眼睁睁看着自己的OpenClaw开始疯狂清空她的历史邮件。

来自主题: AI技术研报
7639 点击    2026-03-12 10:17
让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

刚刚,谷歌发布了首个原生多模态(Multimodal)嵌入模型——Gemini Embedding 2。这次模型最大的变化在于:把文本、图像、视频、音频和文档,全部映射进同一个统一的嵌入空间。

来自主题: AI资讯
6628 点击    2026-03-11 16:59
谷歌Gemini杀入全家桶,血洗微软Office!颠覆全球3亿打工人

谷歌Gemini杀入全家桶,血洗微软Office!颠覆全球3亿打工人

谷歌Gemini杀入全家桶,血洗微软Office!颠覆全球3亿打工人

深夜,谷歌官宣重磅更新!Gemini全面接管Docs、Sheets、Slides,AI原生办公时代来了,全球30亿谷歌用户的办公方式,或正在被彻底颠覆。

来自主题: AI资讯
7704 点击    2026-03-11 16:59
ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

ICLR 2026|原生多模态推理新范式ThinkMorph ,让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出 「ThinkMorph」,主张让文字与图像在统一架构里「原生协作」、「共同演化」,而不是像当下大多数多模态模型那样,看完图像就闭上眼睛,后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型,视觉推理平均提升 34.74%,多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报
6461 点击    2026-03-11 09:22