实测可灵O1,AI视频界的Banana也来了。
实测可灵O1,AI视频界的Banana也来了。昨晚,AI视频领域,终于来了一点新东西。
昨晚,AI视频领域,终于来了一点新东西。
VLA模型性能暴涨300%,背后训练数据还首次实现90%由世界模型生成。
arXiv最新政策禁止直接接收未经同行评审的综述和立场论文,以应对AI生成论文的泛滥,但堵不如疏。多伦多大学、清华、北大等18所国内外顶尖高校联合发布新平台aiXiv,支持AI和人类共同撰写、评审和迭代科研成果,采用多阶段AI同行评审机制,提升效率和质量。
太离谱了!你以为自己在和最先进的 AI 交互,屏幕对面坐着的却可能是两个满头大汗的人类。
2026 年的 AI 领域,会发生哪些变化?哪些技术会成为行业争夺的焦点?在应用层面,又有哪些变量可能彻底重塑市场格局?
当硅谷还在争论AI何时超越人类时,一群「末日信徒」已经把目光投向了世界上最古老的权力中心——梵蒂冈。前谷歌研究员莱文试图抢在科技巨头「安抚」教会之前,给教皇利奥十四世喂下一颗「红药丸」:真正的审判日可能不是神罚,而是失控的代码。这是一场发生在信仰与算法之间的博弈,赌注则是人类在AGI时代的命运。
大家好,我是袋鼠帝。 最近我在折腾本地AI知识库的时候,在Github发现了一个特别有意思的新项目,叫seekdb。
在 Vision-Language Model 领域,提升其复杂推理能力通常依赖于耗费巨大的人工标注数据或启发式奖励。这不仅成本高昂,且难以规模化。
斯坦福和MIT的研究团队推出了一种新的AI智能体推理框架ReCAP,在长上下文任务中全面超越了现有的主流框架ReAct,性能提升显著。ReCAP通过独特的递归树结构和三大机制,解决了大语言模型在复杂任务中常见的目标漂移、上下文断层和成本爆炸等问题。
近一年以来,统一理解与生成模型发展十分迅速,该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型(如 Emu3)与单任务的方法差距巨大,Janus-Pro、BAGEL 通过一步一步解耦模型架构,极大地减小了与单任务模型的性能差距,后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。