刚刚,Anthropic证明:AI开始拥有内省能力
刚刚,Anthropic证明:AI开始拥有内省能力家人们,不知道你有没有试过,在和 AI 聊天时,冷不丁地问一句: “你刚刚在想什么?”
家人们,不知道你有没有试过,在和 AI 聊天时,冷不丁地问一句: “你刚刚在想什么?”
关键时刻,小扎再度出手调整高层架构,前元宇宙负责人Vishal Shah临危受命,接手AI产品管理,协助Nat Friedman整合AI产品战略。空降「高管」与老将的组合,或许可以让Meta的AI狂飙更「稳」一些。
Sora连更三大新功能:角色客串、视频拼接、社区排行榜。趁着更新的热度,Sora APP还在美国、加拿大、日本和韩国四个国家限时取消了邀请码限制,直接开放注册。此前Sora最火爆的功能是Cameo(客串):通过摄像头提取自己的的长相和声音特征,之后,就可以把自己”空投”到任何AI生成的场景里。
用 iPhone 本地跑大模型已经不是新鲜事了,但能不能在 iPhone 上微调模型呢?
近年来,基于扩散模型的图像生成技术发展迅猛,催生了Stable Diffusion、Midjourney等一系列强大的文生图应用。然而,当前主流的训练范式普遍依赖一个核心组件——变分自编码器(VAE),这也带来了长久以来困扰研究者们的几个问题:
OpenAI正酝酿一场史诗级IPO,估值或高达1万亿美元,标志其从非营利探索者向AI巨头全面转型。通过削弱微软控制、强化自身独立性,OpenAI正为资本市场铺路,谋求支撑其万亿级AGI战略的资金弹药。若上市成功,这不仅将改写AI产业格局,也将考验其能否在商业利益与「让全人类受益」的使命之间保持平衡。
随着文图生成模型的广泛应用,模型本身有限的安全防护机制使得用户有机会无意或故意生成有害的图片内容,并且该内容有可能会被恶意使用。现有的安全措施主要依赖文本过滤或概念移除的策略,只能从文图生成模型的生成能力中移除少数几个概念。
新材料研发迎来范式革新!国产自研的RhinoWise智能平台,通过构建「设计–模拟–制备–表征」闭环,可将材料研发周期从传统的数年缩短至「数月」。这一颠覆性技术背后的鼎犀智创公司近日完成数千万级融资。
当你被扔进一片数据的汪洋,老板却期待你一眼看穿本质—— 你是否也曾幻想,有一位不知疲倦、全知全能的 AI 数据专家,能替你搞定从数据管理、准备,到分析的一切工作?
大语言模型(LLM)虽已展现出卓越的代码生成潜力,却依然面临着一道艰巨的挑战:如何在有限的计算资源约束下,同步提升对多种编程语言的理解与生成能力,同时不损害其在主流语言上的性能?
当机器人也开始找人代班,当一个人类操作一个机器人「入侵」你的生活,你会允许吗?
这次不仅发布自研编码模型Composer,还重构了IDE交互逻辑,可以最多8个智能体同时跑,早期测试和开发者都说Cursor 2.0真的太快了。Composer的速度是同等模型的4倍。Cursor说这是一款专门为低延迟智能编码打造的模型,大部分任务都可以在30秒以内完成。
“很正确,无比正确” 当我们问起阿里巴巴 Qoder[1] (Agentic Coding 产品)创始人叔同,关于他带领团队冲入全球 AI Coding 这片“红海” 60 天后的感受时,他给出了这样简单而坚定的回答。他的底气,源自一份优秀的成绩单:上线 5 天用户迅速突破 10 万,仅 60 天斩获 50 万开发者用户。
医疗机构选择AI,只看这三点。很长时间里,医疗始终被认为是新兴技术应用里最难啃的阵地。 就拿医疗数字化来说,就走得极为不容易。在当下7400亿美元的美国医疗管理支出中,IT 预算仅占630亿美元。
杨红霞要走一条和阿里、字节截然不同的模型训练之路。
具身智能赛道的想象力,远比眼前的机器人要辽阔。
最近,一个视频在推上传疯了。
微软 AI 首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)正试图走一条微妙的路线。
AI泡沫,比互联网泡沫还危险?投资人都在装作看不见?
读者,您好!今天想跟您聊一个硬核又极具启发性的项目——HGM(Huxley-Gödel Machine)。我刚刚一起花了几个小时,从环境配置的坑,一路“打怪升级”到让它最终跑完,相信您可能已经从别的公众号上看到了这篇文章。
当下主流的视觉语言模型(Vision-Language Models, VLM),通常都采用这样一种设计思路:将预训练的视觉编码器与大语言模型通过投影层拼接起来。这种模块化架构成就了当前 VLM 的辉煌,但也带来了一系列新的问题——多阶段训练复杂、组件间语义对齐成本高,不同模块的扩展规律难以协调。
多模态图片检索是计算机视觉和多模态机器学习领域很重要的一个任务。现在大家做多模态图片检索一般会用 CLIP/SigLIP 这种视觉语言大模型,因为他们经过了大规模的预训练,所以 zero-shot 的能力比较强。
在灵巧手通用抓取的研究中,由于动作空间维度高、任务具有长程探索特征且涉及多样化物体,传统强化学习(RL)面临探索效率低、奖励函数及训练过程设计复杂等挑战。
AI医学生产力工具开发公司「零假设」近日获近亿元A轮融资,由荷塘创投、国方创新、上海喆驭投资,老股东元禾原点超额认购。本轮融资主要用于打磨、落地场景化AI医学智能体,构建连通药企和医生的学术沟通桥梁。唯快资本长期担任独家融资顾问。
大脑并非一个被动存储和读取的硬盘,而是一个主动预测和生成认知的系统。智力的本质始终在于主动加工,而非被动存储。在AGI时代,我认为“智慧即才华”。就是清楚地知道想要实现的目标,以及实现它的路径,这就是AGI时代的才华。
今夜,英伟达再次创造历史!受GTC大会的影响,英伟达股价上涨4.15%,成为首家市值突破5万亿美元的AI公司!这是一个前所未有的里程碑,不仅是英伟达,不仅是GPU芯片,更是AI时代的里程碑。
最新进展,Cursor 2.0正式发布,并且首次搭载了「内部」大模型。 没错,不是GPT、不是Claude,如今模型栏多了个新名字——Composer。实力相当炸裂:据官方说法,Composer仅需30秒就能完成复杂任务,比同行快400%
生数科技前产品副总裁廖谦创业了。在此之前,他还先后担任过字节剪映与火山引擎前AIGC产品负责人。8月底从老东家离职后,公司成立仅半个月,就已经拿下了硅谷美元基金HT Investment与BV百度风投的数百万美元投资。
国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0重磅发布。
全球首款开卖的家务人形机器人来了!