「10万小时人类数据」不搞对齐只靠规模,灵初智能Psi-R2登顶MolmoSpaces!
「10万小时人类数据」不搞对齐只靠规模,灵初智能Psi-R2登顶MolmoSpaces!4 月 10 日晚,灵初智能发布了大模型、数据集与合作计划:包括策略模型 Psi-R2、世界模型 Psi-W0,以及总规模近 10 万小时的人类操作数据。它想回答的问题也很直接 —— 当真机数据不再是唯一解,机器人还能靠什么继续 scaling?
4 月 10 日晚,灵初智能发布了大模型、数据集与合作计划:包括策略模型 Psi-R2、世界模型 Psi-W0,以及总规模近 10 万小时的人类操作数据。它想回答的问题也很直接 —— 当真机数据不再是唯一解,机器人还能靠什么继续 scaling?
就在刚刚,奥特曼家被炸了。奥特曼发出家人和孩子的照片,并且发出长文表示,AGI如今已经如同魔戒一般,让人做出疯狂的举动。
Factory 发布桌面端应用,让自治 AI 代理(Droids)直接在你的电脑上操控 VS Code、浏览器、终端和 Excel——官方原话是「像你一样操作你的电脑」。多代理并行、持久化机器、本地模型部署一步到位,官方称企业团队采用速度翻倍、会话量暴涨 4.6 倍。发布推文 21 万人围观,近 900 人点赞。
近日,上海人工智能实验室联合南京大学、香港中文大学及上海交通大学,将OpenClaw的成功应用于多模态生成领域。他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。
如果你身边声称将为人类未来负责的人,这样和你聊天,你感受如何: “在应对 ASL-3 级别的灾难性风险时,我们通过机制可解释性的神经解剖,在神经网络的暗物质中,发现了潜伏特工(Sleeper Agen
不知道你们有没有发现,Anthropic最近状况频出得有些反常。又是泄露源代码、又是词元计费BUG,又是降智。小毛病不断、画面不断,讨论声也不断。多少掺点,拿bug当热点炒,蹭免费热搜了。这不,刚又给龙虾之父Peter账号封了。
过去一个月,是今年 AI 产品发布最密集的一个阶段。 如果你留意近期 AI 产品的进展,你会发现,出现了一批真正能主动干活的 Agent 产品。不再是聊天框、问答工具,更像是人类的分身:能自己操控电脑
字节Seed最新研究,让大模型能“原地改参数”了。既不用改模型结构,也不用重新训练,还跑得很快。具体是这么个情况。智能体时代嘛,大家都知道模型们面对的任务开始变得越来越复杂、上下文越来越长。
《终结者》导演詹姆斯·卡梅隆过去的一番论断,迎来了热议:AGI不会来自政府项目,而是由科技巨头打造。这比我在40年前《终结者》中描绘的情景更可怕,因为至少现在它已不再是科幻小说了。
强如Claude,最近的bug也越来越多了。最新热议话题让Hacker News炸开了锅:发帖人G哥(一位软件工程师,在某教育初创公司当CTO)甚至称这是他“迄今为止我在Claude代码中见过的最严重的bug”。
近期,一个叫“同事.skill”的GitHub项目5天收获超过6600颗星,冲上热搜。紧接着,“前任.skill”“老板.skill”“父母.skill”十余个衍生项目接连涌现。网友辣评:“同事,散是Token,聚是Skill。”
多模态大推理模型的幻觉,很多时候并非「没看见」,而是在最不确定的推理阶段想偏了。最新研究发现,模型在生成because、however、wait等transition words时,往往处于高熵关键节点,更容易脱离图像证据、转向语言脑补。LEAD在高熵阶段不急于输出单一离散token,而是先在潜在语义空间保留多种候选推理方向,并通过视觉锚点持续拉回图像证据,显著缓解幻觉。
近日,支付宝开始内测一款名为AClaw的“AI龙虾”小程序。如今,支付宝搜索“龙虾”,结果页除了满屏的外卖推荐,服务一栏里还会出现AClaw的身影。根据官方介绍,AClaw是一个基于当前热门AI Agent框架OpenClaw的Agent类应用。
2023 年,AI 生成的成人内容数量暴涨了 500%。同年,所有新增的成人素材里,有 25% 是 AI 造的。根据经济学人数据,AI 成人行业的规模在 2025 年大概 25 亿美元,这个数字往回倒 1 年是 1.5 亿美元,一年暴增 20 倍以上。AI 成人妥妥的「高速暴增品类」。
近日,京东开源图像模型JoyAI-Image-Edit,将空间智能纳入图像理解与编辑,让AI开始处理真实世界中的空间关系,让模型真正“理解空间,编辑空间”。简单解释,这是一个以空间智能为核心的图像生成与编辑模型,让 AI 真正“看懂”三维空间,从而让生成更合理、编辑更精准。
4 月 10 日,MiniMax 又带来一次重磅更新,其中最核心的新功能,就是 Cover 翻唱。一首平平无奇的生日快乐歌,可以被 cover 成 EDM 风格:经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调:
深夜,Anthropic官宣重磅更新:Claude「顾问策略」(Advisor Strategy)上线。这一架构的核心逻辑是——让智商最高的Opus 4.6退居幕后当「顾问」; 让性价比极高的Sonnet 4.6或Haiku 4.5冲在前面当「执行者」。
养龙虾最怕什么?上一秒喂财报,下一秒全上云!刚刚,无问芯穹推出全模态「龙虾盒子」InfiniClaw Box,文字、语音、视频全模态无死角加密,让云端满血AI为你贴身打工。
哦豁,马斯克一个“不小心”,把Claude参数抖出来了???长话短说:Sonnet 1T、Opus 5T。起因是老马发帖表示,xAI的Colossus 2超算正在训练7个模型,其中最大的一款,参数量直接冲到了10万亿。
《读佳》独家获悉,腾讯做了一款全新的AI创作产品“啵哔酱”,由深圳市网视界科技有限公司(下称“网视界”)开发,根据人民网此前发布的《内测“有记”,腾讯社交新品接二连三攻占细分市场》报道,以及澎湃新闻的相关报道可知,腾讯发布的“有记”、“朋友”等社交APP均为网视界开发,故这里不再对网视界和腾讯之间的关系做过多赘述。目前该产品还处于打磨测试阶段。
MBTI已经过时了!今天,全网被新型SBTI人格测试刷屏,服务器瞬间被挤崩。更狠的是,不到48小时,就有开发者用Claude Code完成了完整逆向复刻。它由B站UP主「蛆肉儿串儿」一人打造,没想到,却被网友们疯狂测试直接挤爆了服务器。
HiVG是一个面向SVG生成的层次化分词框架,在减少63.8% token数量的同时,以仅3B参数在多项指标上超越所有开源SVG模型和GPT-5.2等闭源模型。仅3B参数的HiVG,在SVG生成任务中多项指标超越了GPT-5.2、Claude-4.5-Sonnet等闭源模型。
刚刚,这只爆火的「欢乐马」被认领了!是来自阿里巴巴 ATH 旗下郑波团队的模型,ATH 也就是不久前阿里刚成立的 AI 核心事业群 Alibaba Token Hub。阿里巴巴 ATH 表示:HappyHorse 是阿里 ATH 旗下创新事业部研发的模型,目前正处于内测中,也会于近期开放 API。
一觉醒来,微信公众号开始打击AI了!故事是这样的。 微信公众平台运营规范增加了一条规则:禁止自动化替代真人完成内容创作。 说真的,这个事来得一点都不意外。
2026 年第一季度,它和另外四种完全不同的 Agent 产品形态在同一个窗口期同时冒了出来。OpenClaw 走个人助理、Cowork 走办公协作、Codex App 走长程工程任务、Perplexity Computer 走统一工作站、腾讯云 ADP 走企业平台。
最近,计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。
这个爆火的开源项目,叫做 Hermes Agent,地址:https://github.com/NousResearch/hermes-agent是由 Nous Research 团队倾力打造的开源Agent。
现在,Zilliz 正式推出 MilvusCLI工具与两款官方 Agent Skill(Milvus Skill、Zilliz Cloud Skill),把这条路缩短到只需一句话就能搞定。开发者与运维人员只需通过自然语言指令,就能让 Claude Code、Cursor、Codex 等主流 AI Agent 生成精准可运行的代码、
Codepilot 是藏师傅从今年一月开始纯 Vibe Coding 写个一个全平台通用开源 Agent 客户端。截止目前已经迭代了几百个版本,github 的 Star 也来到了 5100. 支持你能想到的小龙虾和 ClaudeCode 等 Agent 所有的能力,比如:
最近,来自Meta与University of Copenhagen的研究者提出了OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory(收录于CVPR 2026)。这项工作聚焦于一个核心问题:如何在生成多镜头视频时,有效保留长程跨镜头上下文,从而实现更强的叙事一致性。