从多模态大模型中「拆」出音频向量模型
从多模态大模型中「拆」出音频向量模型Google 最近发了 Gemini Embedding 2,他们第一个原生多模态向量模型。文本、图像、视频、音频、文档,全部映射到同一个 3072 维向量空间。这是 Omni Embedding(全模态向量模型)的大趋势:一个架构吃下所有模态,从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5,大家都在往这个方向收敛。
Google 最近发了 Gemini Embedding 2,他们第一个原生多模态向量模型。文本、图像、视频、音频、文档,全部映射到同一个 3072 维向量空间。这是 Omni Embedding(全模态向量模型)的大趋势:一个架构吃下所有模态,从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5,大家都在往这个方向收敛。
上周带大家 0.83 拿下了 GPT Team,后台好多人问我,这个会员能不能变成 API 来用。答案是可以的,而且玩法比你想的多得多。今天这篇就手把手教你怎么搞定,全程跟着做就行,不需要什么技术基础。
Karpathy让AI通宵干活,自己去蒸桑拿了。
国产大模型集体“中毒”,虚假产品“毒害”消费者。
大家好,我是袋鼠帝。 我最近做了一个挺有意思的实验。
在奥斯汀的龙虾大会,15岁的Branson Pfiester分享了他的养虾经历—— 在过去三周里,他使用Home Club这个平台,创造了超过3万美元的合同收入。他还有一个「知识抓取机器人」。当有新客户时,它会对他们进行全面的研究,帮他弄清楚帮助他们业务的最佳方式等等。
这段时间除了有各种 OpenClaw(龙虾)的倡导事件,业内还有一些警告提醒,截至 2026 年 3 月 14 日,OpenClaw 在国内遭遇密集的安全预警和使用限制。本文梳理了从国家级监管机构、金融行业到高等院校各层级已公开的限制措施。
3 月 12 日凌晨,Perplexity 在旧金山 North Beach 一座改建自教堂的场地里,开了首届 Ask 2026 开发者大会,发布了 Personal Computer(个人电脑)。Personal Computer 是在此基础上往前迈了一大步。它运行在你自备的 Mac mini 上,24 小时不间断地访问本地文件、应用和会话记录,把云端的推理能力和本地数据的访问权限真正打通。
数学家陶哲轩,公开了AI新身份——SAIR Foundation联合创始人。之前,他是举世闻名的数学天才,年少成名的传奇数学家、13岁加冕IMO的最年轻金牌得主……24岁就成为加州大学洛杉矶分校(UCLA)史上最年轻的终身正教授。
3月12日(周四),《纽约时报》发布了最新进展:“牛油果”(Avocado)模型确定再次推迟发布。据知情人士透露,Meta 继续开发数月的全新“前沿级”AI 模型,在推理、编程和写作的内部测试中,表现不及 Google、OpenAI 和 Anthropic 等竞争对手的领先模型。