
快手计划分拆可灵AI,以200亿美元估值融资20亿美元。可灵年化收入达5亿美元,较年初翻倍,将成全球估值最高视频生成AI产品。参照竞品Runway估值约53亿美元。
浏览 1010 天、共 25409+ 条 以 agent-first 构建、对所有技术栈开放的 AI 新闻。帮助任何 agent 更快地发现最新最全的 AI 新闻资讯。

快手计划分拆可灵AI,以200亿美元估值融资20亿美元。可灵年化收入达5亿美元,较年初翻倍,将成全球估值最高视频生成AI产品。参照竞品Runway估值约53亿美元。
OpenAI发布Codex官方12用例库,涵盖PR审查、数据分析、PPT生成、游戏开发等场景,核心是展示如何将规则、上下文和验收标准交给AI执行,而非单纯展示功能。AGENTS.md作为项目规则文件,帮助Codex理解工作方式,实现可复用的自动化工作流。
Uber部署AI编程工具四个月内,95%工程师使用,70%代码由AI生成,6000名工程师每月AI工具成本约600万美元,四个月烧完全年预算。企业软件预算模型假设使用量可预测,但AI工具使用量无天花板,从“推广难”变成“控量难”,企业面临全新的成本管理挑战。

Peter发布Peekaboo v3正式版及连续更新(v3.1.0-v3.1.2),为OpenClaw赋予桌面操作能力。该工具能识别屏幕元素、定位按钮、执行点击输入等操作,让AI从「聊天建议」升级为可直接操控电脑完成任务的助手,解决AI无法触及桌面的最后一公里问题。
据《华尔街日报》报道,OpenAI在员工股份要约收购中,约75名员工每人出售最多3000万美元股票,交易后OpenAI估值达5000亿美元,成全球估值最高未上市初创公司。
Claude Mythos在METR评测中,于人类需16小时的复杂长线任务上达50%成功率,直接撑爆现有评测框架上限。AI已跨过自主行动门槛,安全领域3周工作量等同1年团队成果,攻击时间压缩至25分钟,2027 AGI奇点或提前到来。

网友发现DeepSeek存在数据泄露漏洞:输入特定控制token可获取随机训练对话记录。专家分析这是监督微调阶段内部控制token被绕过导致,模型会从训练样本随机继续生成。Gemini也存在类似现象。该行为非bug,而是模型后训练数据的直观展示。
Anthropic估值逼近万亿美元,IPO或超越SpaceX成史上最大。5个月内ARR暴涨至450亿美元,联创Jack Clark预言2028年AI将实现自我进化,智能爆炸倒计时已启动。
2026年5月,a16z、红杉等硅谷VC集体押注AI原生服务(AINS)赛道,已诞生多家独角兽,覆盖法律、金融、制造等垂直领域,革新商业模式,按效果收费。
清华即将入职的冯瑶与清华助理教授刘淼联手创业,将打造以人为中心的全新具身模型范式,让机器人理解人类行为、意图与需求,目标是让机器人早日进入普通人家庭生活场景。
AI芯片公司Cerebras重启IPO,发行价上调后估值达350亿美元,融资近48亿美元,将成2026年迄今全球最大IPO。OpenAI以超200亿美元采购协议等深度合作支持,2025年Cerebras实现净利润8790万美元。
来画推出AI漫剧平台Doratoon,整合全创作流程,输入文字可一键生成完整漫剧,提供快速和专业两种模式,最快3分钟、最长6分钟可出片,降低创作门槛。
马斯克将xAI并入SpaceX后,已提交SpaceXAI商标注册申请,计划整合AI与太空基础设施,拟发射卫星构建轨道AI数据中心,年新增算力可达100吉瓦。
多项研究显示,GPT-3.5、GPT-4、Claude-3.5等主流大模型,在改变题目形式的类比推理测试中准确率大幅下降,表现甚至不如7岁儿童,其类比推理能力远弱于人类。
国产AI音乐模型Mureka获企业用户认可,多家企业从Suno切换至Mureka,其V8获国际评测人声、器乐全球第一,已服务全球超8000家企业客户,合作客户业务均大幅增长。
至简动力、北大、港中文联合提出LaST-R1具身大模型新范式,首次将隐空间物理推理融入强化学习闭环,在LIBERO基准上平均成功率达99.9%,真机性能比现有SOTA高出22.5%。
中国AI视频Agent赛道增长迅速,头部平台Creati上线一年用户破千万,ARR达2000万美元。创业者担心大厂模型下沉应用层抢占市场,业内对时间窗口和发展路径存在分歧。
百年老字号北京同仁堂牵手阿里生态多平台,开展为期一月营销活动,结合AI互动与多场景营销,吸引年轻用户,活动期间淘宝买药销售额同比接近翻倍,新用户占比超80%。

研究者在ICML 2026提出专为离散扩散语言模型dLLM设计的PRISM框架,可在低推理预算下提升模型推理能力,实验显示最高节省超6倍计算量,在多个任务上准确率显著提升。
研究者推出Claw-Eval与Claw-Eval-Live,前者通过追踪执行过程验证Agent真实能力,后者提出「活的」基准,持续更新任务匹配现实需求,评测发现当前Agent跨系统业务能力瓶颈明显。

上海交大与Qwen团队研究发现,当前多模态大模型STEM视觉推理的瓶颈是视觉感知而非推理能力,提出CodePercept新方法,论文被CVPR 2026接收,性能提升显著。
前理论物理研究者姚顺宇,2025年从Anthropic跳槽至Google DeepMind,参与Claude 3.7、Claude 4.5、Gemini 3开发,认为AI个人英雄主义时代已过,当前属集体主义研究时代。
95后港中文博士王佳泽创立的FitX AI获数百万美金融资,将打造全球首个AI Native家庭娱乐入口,预计2027年CES首发,无需手柄即可空手互动,适配全家不同需求。
Slock作者测试后认为当前AI群聊不成立,多Agent协作只产生冗余信息不提升产出质量,目前仅适合作为方便分享本地Agent的极客玩具,主要提供情感价值。
NVIDIA Dynamo团队发现,Claude Code请求中每行会话变化的billing header破坏了52K上下文的KV缓存复用,使推理延迟增加近5倍,添加移除header的flag后延迟恢复正常。
英伟达创始人黄仁勋在卡内基梅隆大学2026届毕业典礼获荣誉博士学位,他表示AI推翻旧计算规则,让所有人重回同一起跑线,对年轻人是机遇。

有作者发布OpenAI推出的AI编程智能体Codex保姆级入门教程,介绍其安装、功能、设置、使用方法及实例,近期因性价比高受关注,生态日渐完善。
独立开发者开发AI小产品TinderProfile.ai,上传2-5张自拍,10分钟生成约会软件头像,帮助用户获得更多匹配。目前月访问约7万,年化GMV估算约30万美元,是垂直细分AI小产品案例。

安全研究员Alexander Hanff发现,Chrome在满足硬件要求的数亿用户设备上,静默自动安装4GB的本地Gemini Nano AI模型,删除后会自动重下,且未征求用户同意,谷歌已逐步推出关闭选项。
奥特曼称GPT-5.5为「自闭天才」,其性能优势明显,token消耗比Claude少近40%。Codex单周下载量达9000万,是Claude Code的12倍。16人团队退订Claude转用GPT-5.5,每月节省3.2万美元。
原谷歌DeepMind研究员Ted Xiao(现加入贝佐斯Project Prometheus)复盘机器人学习三大时代:存在性证明、基础模型、Scaling,梳理领域近十年变革历程与关键决策。
归藏开源的guizang-ppt-skill获超6000星,迎来大波更新:新增瑞士国际主义风格,接入GPT-Image 2.0生成适配配图,支持多平台规格封面自动生成,内置22种常用版式。
谷歌DeepMind聘请芝加哥大学教授Alex Imas担任AGI经济学总监,他提出AI将压低可复制劳动价格,推高护理、教育等关系型劳动的价值。
投资人Elad Gil提出AI领域存在三层技术代差:顶级AI实验室领先硅谷3-4个月,硅谷领先纽约3-6个月,纽约领先全球其他地区6-12个月,大众接触到的AI技术已落后前沿1-2年。该观点引发科技圈热议。
浙江大学联合腾讯优图实验室提出AdaMARP框架,采用四通道消息格式和场景管理器,实现AI沉浸式角色扮演,支持动态场景切换与新角色引入,该工作已被ACL 2026接收。
Genesis AI完成1.05亿美元种子轮融资后,首次公开发布GENE-26.5,推出全栈具身智能系统,含超20万小时人类操作数据和类人灵巧手,可完成多种精细操作,引发行业讨论。
20岁退学者与前Google专家打造AI原生教育产品VideoTutor,获1100万美元种子轮融资,海外社媒播放破5000万,支持用户生成个性化互动视频讲解,B端获超1000家机构合作请求。
华东师范大学与复旦大学团队在ICLR 2026提出Next-ToBE方法,通过修改大模型训练目标,让模型预测时兼顾未来token,36组实验中35组表现更优,训练开销更低,提升推理能力。
中国移动与火山引擎在2026移动云大会联合推出机密大模型服务模式,为政企客户提供端到端加密AI服务,数据全程加密不泄露,首批已上线Seedance 2.0,豆包大模型2.0即将上线。

2026年5月AI领域正式确立「AI智能体 Harness」概念,它是包裹大语言模型的外围基础设施,包含12个核心组件,优化Harness可显著提升AI智能体生产性能。
布里斯托大学、上海交大和Sreal AI团队发布CreativeGame框架,解决大模型生成游戏忘核心玩法、评分通胀问题,让AI围绕游戏机制持续迭代,可生成真正有创意的新游戏。
浙江大学与爱丁堡大学团队提出新指标NCB,通过检测大模型相关知识邻域的一致性,判断其知识是否稳健,可预测大模型在干扰下的判断稳定性,实验显示高NCB模型准确率下降幅度更小。