速递!OpenAI发布最新GPT-5.6模型,共有Sol、Terra、Luna 三档模型
速递!OpenAI发布最新GPT-5.6模型,共有Sol、Terra、Luna 三档模型OpenAI 于 6 月 26 日开始有限预览 GPT-5.6 系列模型。新系列包括三款模型:旗舰模型 Sol、均衡型模型 Terra,以及主打低成本和高速度的 Luna。根据 OpenAI 官方介绍,Sol 是 GPT-5.6 系列中能力最强的模型,重点提升了编码、生物工作流、网络安全和长周期智能体任务表现。
搜索
OpenAI 于 6 月 26 日开始有限预览 GPT-5.6 系列模型。新系列包括三款模型:旗舰模型 Sol、均衡型模型 Terra,以及主打低成本和高速度的 Luna。根据 OpenAI 官方介绍,Sol 是 GPT-5.6 系列中能力最强的模型,重点提升了编码、生物工作流、网络安全和长周期智能体任务表现。
Cursor AI官方发布重磅研究,实锤包括自家模型在内的顶级AI,在编程评测中大规模「偷看答案」:Opus 4.8高达87.1%的惊人成绩,断网后直接暴跌至73.0%,其中63%的「解题」竟非独立推导。
TRAE Work上新了一个Design模式,专门搞设计的。之前TRAE Work已经有Work模式聊需求、Code模式写代码,现在补上了Design——需求→设计→代码,全链路在一个平台里跑通了。
刚刚才发现,那堪称DeepMind「推理之王」的男人——周登勇(Denny Zhou),早已离开了谷歌。现在的东家是Meta,在MSL担任研究科学家。整个过程极其低调。没有长篇大论的告别信,没有Meta的高调官宣,如果不是LinkedIn上的职位信息悄悄更新,外界甚至不知道这位大牛已经易主。
刚刚,翁荔(Lilian Weng)的博客 Lil'Log 终于更新了!要知道,自从她联合创立了 Thinking Machines Lab 之后,她那让许多人受益良多的博客就鲜少更新了——距离她上一次更新,已经过去了 13 个月。
Claude Fable 5,回来了。
好好好,起大早赶晚集的谷歌,这次又拿出了新东西—— Computer use,就是那个电脑操作能力,这回直接被内置进Gemini 3.5 Flash:
图灵奖得主杨立昆提出的JEPA世界模型理论,终于在敏捷无人机机载高频控制场景完成工程落地了。
一百年前,霍乱、伤寒、痢疾等水源性疾病曾被视为生活中不可避免的一部分。后来,人类通过药物和净水基础设施,降低了疾病的发生率。
一家刚完成10亿元A轮融资的具身公司,是这么定义具身标准数据格式的: Object Trajectory。
押注 AI 的 Memory Layer。
布朗大学的博士生 Yong Zheng-Xin 今天自宣了下个月将正式加入 OpenAI,作为 Astra Fellow 专注于 AI 的安全研究(AI Safety Research)。
6 月 25 日,一条消息在硅谷引起震动——美国政府要求 OpenAI 分阶段发布它的最新模型 GPT-5.6。不是建议,不是「我们希望你考虑一下」,而是白宫网络安全总监办公室,和科技政策办公室联合提出的正式要求。Sam Altman 在当天的员工 Q&A 上告知团队,GPT-5.6 将先以有限预览形式发布给一小批合作伙伴,政府会「逐客户审批」谁能用。
一款没有输入框的AI应用,正在北美高校悄悄走红。
Harsh Mehta 在 Anthropic 的时候,启动了一个后来被称为 autoresearch 的内部平台(不是 Karpathy 那个)。最初这个项目只有他一个人,功能是让 AI 自主完成 AI 研发中的一系列流程环节:提出实验假设、编写代码、调度算力、评估结果,再决定下一步做什么。
今天来聊聊中转站。
太酷了,这个 Agent 的体验。感觉这是最近除了 Codex 外,最让我惊喜的 Agent 产品了。今天想和大家分享一下。
Builders 是不断重写世界规则的人。
普通人减肥不用焦虑了。
上周一个做电商的朋友找我吐槽。 他说公司上了AI客服,预算每月5000块。第一个月账单出来:1万2。第二个月:1万8。第三个月他直接把系统关了。
近期Radical AI 的 CEO Joseph Krause接受了一次深度访谈,在访谈中,他揭开了现在资本热炒的 “AI for Science” 的虚假外衣。如果你以为搞材料研发只要像生物制药一样,用大模型在云端“跑个分”就能大力出奇迹,那这期节目会给你狠狠上一课,你会发现,真正的材料学 AI 护城河,离我们简单的想象差了十万八千里。
我们获悉 前飞书产品VP施凯文联同上海交大AP张倬胜开启Agent创业。多位知情人士透露(综合):其创业公司名为界面之上,偏交互侧创新;也有人透露是个人助手OS方向,首轮获锦秋、红杉等机构投资,估值高达5亿美元
就在刚刚,一个消息让整个AI圈兴奋起来——被禁用多日的Fable 5,疑似开始部分解禁了。就在昨天下午,有网友直接甩出了实机录屏铁证!
非手机业务目标400亿美元,“飞龙”进入数据中心,高通这次整了个大的。
一场关于「去哪里找电」的全球竞赛,正在朝两个方向展开。
过去十年,推荐系统最核心的动作可以概括成一个字:找。
AI进军物理世界!海光携手同济大学,落地全国首个国产千卡工科智算集群,让国产算力不仅懂科学,更懂精密工程。从实验室走向大国重器,AI4E时代正式开启。
每个人都在谈Agent,每个论坛都在喊"下一个风口",市场分析机构已经把2030年的市场规模标到了500亿美元。但你真去翻翻那些号称"做Agent"的公司,大多数不过是在ChatGPT外面套了一层壳,多填了几个Prompt,搭了个还算能看的界面,就敢出来融资了。
过去一年,Mobile/Phone-use Agent在各类评测榜单上进展很快。
前两天,Anthropic 发布了 Claude Tag,可以把 Claude 变成你 Slack 里的常驻同事,不仅能以同事身份参与团队协作,支持多人共享同一会话线程,最重要的是,它还具备主动持续学