OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶
OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶OpenAI又要成立新团队了!
OpenAI又要成立新团队了!
继π0后,具身智能基座模型在中国也终于迎来了真正的开源—— 刚刚,WALL-OSS宣布正式开源!在多项指标中,它还超越了π0。如果你是搞具身的开发者,了解它的基本资料,你就一定不会想错过它:
BVP最新报告中,AI原生企业成为最大驱动力,22家AI公司合计贡献4640亿美元市值,占比42%,较2024年翻倍。这份报告不仅揭示了AI如何重塑云计算版图,还为投资人和创始人提供了关于估值趋势、增长速度、IPO窗口和人才军备竞赛的第一手洞察。
如果把当下最让人迷惑的科技产品拉个清单,AI 硬件网红们绝对榜上有名。 从 699 美元的 Humane Ai Pin 到 200 美元的 Rabbit R1,这些 AI 创业公司都在兜售同一个美丽的谎言:你需要专门的硬件才能体验真正的 AI。 今天,这个名单上又多了一个新成员——AI Key。
好玩好用的明星视频生成产品再更新,用户操作基础,模型技术就不基础。
经历了前段时间的鸡飞狗跳,扎克伯格的投资似乎终于初见成效。
近日,AI制药企业Treeline Biosciences宣布将进行首批三个管线的临床试验并获得2亿美元的额外资金。 至此,这家神秘而低调的企业已经融了11亿美元。
你有没有想过,网站的时代真的结束了?我们正在目睹一场静悄悄的革命:AI agent 正在重新定义内容发现的游戏规则,而大多数企业甚至还没意识到自己的网站内容已经对AI"隐形"了。这不是什么遥远的未来预测,而是正在发生的现实。
自2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。
很惊喜,真没想到 Nano Banana 刚体验几天,咱们即梦4.0火速跟上了。不是赶鸭子上架那种,是真的很强的猛猛大货上新。 先说小结论:总体效果还是很不错的,进步很大也很方便。有的地方有些小的不足,后续在图片和文字中我会有提到。
近日,备受关注的德里亚·巴茨(Andrea Bartz)等诉Anthropic公司的集体诉讼案以一项高达15亿美元的和解协议暂告段落。该案自立案之初便牵动科技界与版权界神经,其最终处理结果及创纪录的和解金额,在AI行业内引发强烈震动。
Computer use是真正Agents的关键驱动力。它们的有效性取决于两个因素:能够接入多少工具,以及能否在这些工具之间进行推理。Computer use显著拓展了这两方面的能力——既赋予Agents使用任意软件的广度,也提升了它们将一系列动作串联成完整工作流的智能。
在我前两天写过一篇AI自习室爆掉之后,很多粉丝在聊,有哪些好用的AI学习方法。
你有没有想过,AI公司终有一天会不再满足于给好莱坞当"乙方"?最近发生的一件事让我意识到,这个转折点来得比想象中更快。一家名为Cybever的AI初创公司突然宣布转型,直接摇身一变成了Utopai Studios——全球首家AI原生影视工作室。
在多模态大模型的基座上,视觉 - 语言 - 动作(Visual-Language-Action, VLA)模型使用大量机器人操作数据进行预训练,有望实现通用的具身操作能力。
淘宝目前对AI技术的应用,是试图让消费者更轻松地做出决定。
光刻机巨头ASML斥资15亿美元,领投「欧版OpenAI」——Mistral AI。这家成立仅两年的AI初创,估值已达140亿美元。路透独家,ASML豪掷15亿美元领投Mistral AI,将成为这家法国AI新星的最大股东。
用模型学习模型,为企业主生产更容易被AI推荐的营销内容。
3999元,不够买一台苹果手机,但能DIY个机器人(doge)。
做了大量的用户调研后,Ropet团队得到一个重要认知,用户对于AI情感陪伴产品的需求,其实并不是“对话”。
苹果在 Hugging Face上放大招了!这次直接甩出两条多模态主线:FastVLM主打「快」,字幕能做到秒回;MobileCLIP2主打「轻」,在 iPhone 上也能起飞。更妙的是,模型和Demo已经全开放,Safari网页就能体验。大模型,真·跑上手机了。
一年前的今天,特工宇宙团队在外滩大会上首次接触到蚂蚁百宝箱团队。
AI界奥数杯,重启了!OpenAI o3首次杀入赛场,在算力拉满的情况下,直接以最高47分的逆天成绩炸翻全场。值得一提的是,前五模型合并得分仅与o3差5分,开源与闭源差距再次缩小。
翻译耳机这个新赛道,当巨头还在做「功能」,这家公司已在定义「体验」。
事到如今,学会使用AI辅助工作已经成为重要的技能之一,对创作也是如此。
香港科技大学谭平教授团队与地平线(Horizon Robotics)团队最新发布了一项 3D 场景表征与大规模重建新方法 SAIL-Recon,通过锚点图建立构建场景全局隐式表征,突破现有 VGGT 基础模型对于大规模视觉定位与 3D 重建的处理能力瓶颈,实现万帧级的场景表征抽取与定位重建,将空间智能「3D 表征与建模」前沿推向一个新的高度。
Meta豪掷143亿收购Scale AI,意外成就了3名22岁青年的创业神话!他们靠着为OpenAI等顶级AI实验室输送模型专家训练师,干出百亿独角兽Mercor,年入1亿美金。目前,Mercor在《福布斯》Cloud 100 榜单中排名第89位。
开放词汇识别与分类对于全面理解现实世界的 3D 场景至关重要。目前,所有现有方法在训练或推理过程中都依赖于 2D 或文本模态。这凸显出缺乏能够单独处理 3D 数据以进行端到端语义学习的模型,以及训练此类模型所需的数据。与此同时,3DGS 已成为各种视觉任务中 3D 场景表达的重要标准之一。
让大模型破译从未见过的甲骨文,准确率拿下新SOTA!
周末在家扒拉上周更新的论文的时候,看到一篇我自己一直非常关心的领域的论文,而且还是来自发论文发的越来越少的OpenAI。