AI资讯新闻榜单内容搜索-不

跟这个音乐Agent聊会儿，分分钟生成抖音神曲 | 对话音乐创作Agent产品Tunee

“人人都能玩点音乐”，Tunee真的做到了。这也说明，AI创作领域产品真的从“工具产品”迈向“智能体交互产品”了。在AI创作领域，玩家可不少。诸如星流、Manus、海螺AI、美图秀秀等成熟玩家，以及近期爆火的Liblib AI纷纷入场卷起Agent能力，产品功能或围绕平台生态、或深入垂直场景不断迭代优化细节。

来自主题: AI资讯

9066 点击 2025-11-02 10:22

少量视角也能得到完整3D几何，即插即用的语义增强重建插件来了

直观经验却告诉我们，只要把同一物体的 “对应部分” 对齐，形状就会变得清晰。基于这一朴素而有效的直觉，作者提出SERES（Semantic-Aware Reconstruction from Sparse Views），在不改动主干框架的前提下，把跨视角的语义一致性变成一种训练期先验注入到模型里，用低成本的方法去解决高价值的歧义问题，让少量视角也能得到清晰而完整的几何。

来自主题: AI技术研报

7615 点击 2025-11-02 10:03

AI 画作卖出 100 多万，这个世界没有疯

不知道还有多少人记得，三年前有一幅名为《太空歌剧院》的作品：恢弘的大厅里，名伶身着华服，站在舞台上，庄重又华丽。这幅作品由游戏设计师杰森·艾伦（Jason Allen）借助 Midjourney 生成，并经由 Photoshop 润色完成。美国科罗拉多州博览会的艺术比赛中夺得数字艺术类别的头奖——一经公示，质疑声四起，许多人指责艾伦「拿 AI 的成果充当自己的作品」去参赛。

来自主题: AI资讯

9220 点击 2025-11-01 13:11

最新外国「自研」大模型，都是套壳国产？

绷不住了，美国科技公司最新发布的大模型，思考时怎么一直在说中文？据官方博客介绍，在研发过程中，他们试验了一个代号为 Cheetah 的原型智能体模型，以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版，凭借足够的速度支撑交互式体验，让编码始终丝滑。

来自主题: AI资讯

9264 点击 2025-11-01 13:08

人在美国，待过三家AI Lab，全凉了！

科技行业全球10万大裁员，连10年老将田渊栋都被Meta裁掉了！昨天，南洋理工大学的副教授Boyang Li吊足了大家的胃口：Meta FAIR最近的事件很抓马，但工业研究为什么这么难？我想知道大家愿不愿意听一下我的观点。

来自主题: AI资讯

9005 点击 2025-11-01 09:40

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

最新最强的开源原生多模态世界模型—— 北京智源人工智能研究院（BAAI）的悟界·Emu3.5来炸场了。图、文、视频任务一网打尽，不仅能画图改图，还能生成图文教程，视频任务更是增加了物理真实性。

来自主题: AI资讯

8348 点击 2025-11-01 09:36

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

9681 点击 2025-11-01 09:23

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

月之暗面最新发布的开源Kimi Linear架构，用一种全新的注意力机制，在相同训练条件下首次超越了全注意力模型。在长上下文任务中，它不仅减少了75%的KV缓存需求，还实现了高达6倍的推理加速。

来自主题: AI技术研报

10556 点击 2025-10-31 15:46

让 AI 开口「像人」：最难的不是智能，是「嗓音」

Voice Agent 赛道正在爆发，但它迫切需要一个能让对话真正「流动起来」的底层引擎，一个能撑起下一代交互体验的 TTS 模型。竞争的焦点，已经从 LLM 的「大脑」，延伸到了 TTS 的「嗓音」。谁掌握嗓音，谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型，似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯

9415 点击 2025-10-31 15:35

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

刚刚，OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。目前，Aardvark还处于beta测试阶段。OpenAI称，Aardvark开创了「防御者优先」的新范式：作为自主安全研究智能体，随代码不断演化，为团队提供持续保护（continuous protection）。

来自主题: AI资讯

9467 点击 2025-10-31 15:34