AI资讯新闻榜单内容搜索-人工智能

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

最新最强的开源原生多模态世界模型—— 北京智源人工智能研究院（BAAI）的悟界·Emu3.5来炸场了。图、文、视频任务一网打尽，不仅能画图改图，还能生成图文教程，视频任务更是增加了物理真实性。

来自主题: AI资讯

6854 点击 2025-11-01 09:36

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

论文第一作者何浩然是香港科技大学博士生，研究方向包括强化学习和基础模型等，研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计

来自主题: AI技术研报

7898 点击 2025-11-01 09:24

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

8062 点击 2025-11-01 09:23

从 SD 到 Wan2.5-Preview，AI 视频 2025 质变启示录

最大的时代红利，属于今年四季度发布的中美两大明星产品，OpenAI 的 Sora 2 与阿里的 Wan2.5-Preview。其中，Sora 2 的登场堪称一场教科书级的营销战役。熟悉的邀请码机制再次奏效，用户为了获得一个入场券除了需要购买 GPT 的会员之外，甚至还在二手平台再花几十美金购买邀请码。更绝的是，它把自己变成了一个 AI 版抖音，

来自主题: AI资讯

6613 点击 2025-11-01 09:21

Sora天才辍学生归来！OpenAI组建3人神秘小队，豪赌超级人工智能

Sora背后的核心贡献者之一，这位00后的天才辍学生Will Depue，准备再次搞个大事情。刚刚，他宣布下一个目标是，超级人工智能ASI！在结束一段长期休息后，Will Depue宣布他再次回到OpenAI。

来自主题: AI资讯

7607 点击 2025-10-31 15:47

大模型公司不搞浏览器搞Agent，实测找到原因了

闻乐发自凹非寺量子位 | 公众号 QbitAI 如果Agent能操作命令行，就有了与整个计算机系统交互的能力。也意味着一台计算机的几乎所有功能，都可以通过自然语言来驱动。这种产品终于有雏形了

来自主题: AI资讯

8009 点击 2025-10-31 15:17

微软独家：OpenAI最新季度净亏损115亿美元

这下知道OpenAI为啥要转型公共利益公司了……眼尖的网友发现，OpenAI上季度居然亏了115亿美元！重点是，这可不是哪家媒体的小道消息啊，而是OpenAI的最大金主——微软自己亲手捅出来的。

来自主题: AI资讯

8396 点击 2025-10-31 15:14

你有多久没在下五子棋的时候又唱又跳了？我用 AI 试了试

你有多久没试过在用 AI 写歌的时候又唱又跳了？——没有人在用 AI 写歌的时候又唱又跳！这是 YouTube 上的一位音乐博主，本想用音乐生成软件做一些糟糕的 AI 音乐，取笑一下人工智能，却意外得到了「味挺正」的日本金属摇滚，一下子就在 TikTok 上迅速爆红。

来自主题: AI资讯

7266 点击 2025-10-31 15:13

最火VLA，看这一篇综述就够了

ICLR 2026爆火领域VLA（Vision-Language-Action，视觉-语言-动作）全面综述来了！如果你还不了解VLA是什么，以及这个让机器人学者集体兴奋的领域进展如何，看这一篇就够了。

来自主题: AI技术研报

7208 点击 2025-10-31 14:59

AI「上班流」首次完整曝光！不点鼠标，只写代码，PPT也当函数调

AI已经不止会写代码、画图、做PPT，它也开始「上班」了！CMU与斯坦福的研究团队首次完整追踪了AI的工作过程，发现一个惊人事实：它并不是在模仿人类，而是在用编程的方式重写工作的定义。这场关于「谁在工作」的实验，正在重构未来职场的逻辑。

来自主题: AI技术研报

6888 点击 2025-10-31 14:47