AI资讯新闻榜单内容搜索-Ed

谷歌AGI底座降临！首个原生全模态嵌入模型上线，已实现全模态SOTA

谷歌发布首个原生全模态 Embedding 模型 Gemini Embedding 2！它将文本、图、音视频及 PDF 无损融于统一向量空间，实现跨越五大模态的直接检索。这极大降低了架构成本，赋予了 AI 真正连贯的「记忆」，是重塑 AI 基建的里程碑。

来自主题: AI资讯

9777 点击 2026-03-12 10:21

让龙虾看懂屏幕！谷歌多模态新成果，文本图像视频音频进同一空间

刚刚，谷歌发布了首个原生多模态（Multimodal）嵌入模型——Gemini Embedding 2。这次模型最大的变化在于：把文本、图像、视频、音频和文档，全部映射进同一个统一的嵌入空间。

来自主题: AI资讯

7351 点击 2026-03-11 16:59

OpenClaw 之后我开始思考：Agent 最重要的两种能力是什么？

OpenClaw 爆火之后，我一直在想一个问题：如果把 AI Agent 当作一个员工来看，未来最重要的能力是什么？

来自主题: AI资讯

7898 点击 2026-03-11 10:01

14B规模竟也能单卡实时生成视频？多亏这个强大的开源底座

春节期间， Seedance 2.0 爆火，堪称现象级，这也再次把视频生成推上风口。前两天，字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 Helios 家族。该系列包含了 Helios-Base、Helios-Mid 与 Helios-Distilled 三个版本，全面覆盖了 T2V、I2V、V2V 以及交互式生成任务。

来自主题: AI技术研报

10318 点击 2026-03-09 15:05

多模态预训练，才是大模型的下一条路？Yann LeCun、谢赛宁参与

基础模型时代，大模型能力的爆发，很大程度上源于在海量文本上的预训练。然而问题在于，文本本质上只是人类对现实世界的一种抽象表达，是对真实世界信息的有损压缩。

来自主题: AI技术研报

10185 点击 2026-03-09 09:53

30B参数超越GPT-5！REDSearcher让「深度搜索Agent」做到低成本可扩展！

「2018 到 2023 年间在 EMNLP 会议上发表的那篇论文中，第一作者本科就读于达特茅斯学院、第四作者本科就读于宾夕法尼亚大学的那篇科学论文，题目是什么？」

来自主题: AI技术研报

8182 点击 2026-03-09 09:51

用Rust重写OpenClaw，Transformer作者下场造了安全版「龙虾」

面对 OpenClaw（龙虾）可能存在的「恶意利用用户数据和资金」的重大风险，Transformer 八子之一 Illia Polosukhin 出手了。今天，Illia Polosukhin 在 Reddit 上发了一则帖子，深谈了其使用 Rust 来构建安全版 OpenClaw 的心路历程，引起了热议。

来自主题: AI资讯

9042 点击 2026-03-07 11:10

基础模型又一关键拼图，腾讯混元发布训练新范式「无相」：引入功能性记忆，打破静态权重枷锁

3月6日，腾讯混元发布了一篇名为“HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing”的技术报告。提出了一种崭新的功能性记忆（functional neural memory）范式（weight unleashing），

来自主题: AI技术研报

9549 点击 2026-03-07 11:08

1秒1元！Seedance 2.0模型定价公布，短剧真的要被颠覆了

火山引擎官网，现已公布Seedance 2.0模型定价。包含视频输入的价格是28元/百万tokens，不含视频输入的价格则是46元/百万tokens。使用Seedance 2.0生成一条15秒的标准视频（720p，24fps），大概要消耗30.888万tokens。

来自主题: AI资讯

10527 点击 2026-03-06 15:40

字节清华智能体自动写CUDA内核，比torch.compile加速2.11倍

让AI自己写高性能GPU代码，字节Seed与清华AIR团队做到了。

来自主题: AI技术研报

8318 点击 2026-03-04 10:39