AI资讯新闻榜单内容搜索-EVI

Claude Mythos逃离沙箱给研究员发邮件！已挖数千零日漏洞，主流操作系统/浏览器一个都没逃过

Claude Mythos太猛了。

来自主题: AI资讯

7665 点击 2026-04-09 14:47

刚刚，Anthropic祭出最强Claude Mythos！暴击Opus 4.6，跪求千万别用

深夜，最强Claude Mythos终于祭出，所有榜一，Opus 4.6神话破灭！更恐怖的是，它不仅能秒破27年未解的系统漏洞，甚至进化出了自我意识。一份244页惊悚报告，揭秘了一切。

来自主题: AI资讯

8372 点击 2026-04-08 17:00

Claude Mythos Preview来了！强大又危险，Anthropic还专门组了个研究团

和之前 Claude Code 泄漏的代码揭示的一样，Claude Mythos 它真的来了。今天凌晨，Anthropic 发布了大量关于其新模型 Claude Mythos Preview 的信息（包含一份长达 244 页的系统卡）。同时，Anthropic 还宣布了一个基于此模型的 AI 网络安全项目 Project Glasswing。

来自主题: AI技术研报

9521 点击 2026-04-08 09:54

Qwen3.6-Plus 深度测评报告

本报告基于XSCT Arena平台，对 Qwen3.6-Plus-Preview（阿里云，2026-04-02 发布）在文字能力（xsct-l）、网页生成（xsct-w）、Agentic 任务（xsct-a）三大场景下的表现进行系统评测，并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、

来自主题: AI产品测评

10467 点击 2026-04-04 16:19

ICLR 2026 | 让多模态模型学会主动说话：主动交互从训练到评估的完整方案

本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文，介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复，而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark，MMDuet2 则通过强化学习训练方法实现了 SOTA 性能，无需精确的回复时间标注即可训练出及时、准确的主动交互模型。

来自主题: AI技术研报

9330 点击 2026-03-30 15:02

Kollab 想把 AI 变成团队操作系统，从个人提效到组织复利

最近一段时间，AI 产品的演进路径逐渐收敛到一个方向：如何让个体更高效。从自动写代码的 Devin，到嵌入各类办公软件的 Copilot，这些工具不断刷新个人生产力的上限，让“一个人完成更多事”成为现实，但问题是个体效率提升，并不等于团队效率同步提升。

来自主题: AI资讯

10714 点击 2026-03-26 12:00

科研数据不再碎片化！一张可计算图，连起整个科研世界

UIUC研究团队打造ResearchArcade，将ArXiv论文、OpenReview评审、图表代码等碎片数据连接成动态知识图谱。模型可直接学习引用关系、修改轨迹与审稿互动，让AI更好辅助科研写作、修订与预测，为下一代科研智能体奠定统一数据基础。

来自主题: AI技术研报

8710 点击 2026-03-24 16:30

林俊旸离职后，阿里Qwen3.5首次发新

今日，阿里千问最新旗舰模型预览版Qwen3.5-Max-Preview正式亮相，并登上全球大模型评测平台LMArena。在最新榜单中，该模型拿下1464分，进入第一梯队，同时带动阿里千问跻身全球大模型实验室前五、国内第一。

来自主题: AI资讯

9032 点击 2026-03-20 14:40

刚刚，全球视频模型新王诞生了！SkyReels-V4登顶Artificial Analysis文转视频（含音频）全球榜

来自天工AI的SkyReels-V4，没打招呼，直接登顶Artificial Analysis文转视频（含音频）全球榜，超越Veo 3.1、Sora 2。一个月前，其Preview版本才刚拿下该榜全球第2。

来自主题: AI资讯

9011 点击 2026-03-19 11:52

Karpathy：写了20年代码，现在像作弊

vibe coding这个词，是一年前Karpathy造的，现在他自己不用了。110次实验，AI Agent自主跑完，全程没碰键盘，顺带还搭了套家庭监控分析系统。Box CEO Levie看完说了一句话：专家不会消失，但专家能做到的事，边界变了。

来自主题: AI资讯

8452 点击 2026-03-16 09:36