用两个简单模块实现分割理解双重SOTA!华科大白翔团队等推出多模态新框架
用两个简单模块实现分割理解双重SOTA!华科大白翔团队等推出多模态新框架多模态大模型需要干的活,已经从最初的文生图,扩展到了像素级任务(图像分割)。
多模态大模型需要干的活,已经从最初的文生图,扩展到了像素级任务(图像分割)。
来自牛津大学、新加坡国立大学、伊利诺伊大学厄巴纳-香槟分校,伦敦大学学院、帝国理工学院、上海人工智能实验室等等全球 16 家顶尖研究机构的学者,共同撰写并发布了长达百页的综述:《The Landscape of Agentic Reinforcement Learning for LLMs: A Survey》。
见证历史!OpenAI估值已飙升至5000亿美元,一举超越SpaceX,跃升为全球最贵独角兽企业。无独有偶,马斯克个人财富也同步突破5000亿美元大关,其个人身价已堪比一家OpenAI。
Anthropic宣布任命前Stripe CTO Rahul Patil为新任首席技术官,此次换帅旨在强化Anthropic的AI基础设施,以应对Claude产品快速增长带来的算力和能耗压力。同时,也是为了面对OpenAI和Meta数千亿美元级的基础设施投入而进行的一次战略调整。
Sora2太卷了。居然能预测ChatGPT的输出、渲染HTML?!让它模拟“给ChatGPT发信息”,它不仅生成了画面,还来了一段有问有答的“交互”。先是编了一个问题:Write a playful haiku about a cat staring out the window.(写一首关于猫凝视窗外的俏皮俳句。)
来自斯坦福大学、哥伦比亚大学、摩根大通AI研究院、卡耐基梅隆大学、英伟达提出了一种数据采集与策略学习框架DexUMI——利用人手作为自然接口将灵巧操作技能迁移至多种灵巧手。该框架通过硬件与软件的双重适配,最大限度缩小人手与各类灵巧手之间的具身差异。
Sora 2火爆全球!上线不到24小时便冲上苹果商店榜单前三,凭借「1换4」邀请码机制和「Cameo自我上传」玩法,引爆社交传播。奥特曼亲自下场,让邀请码成为稀缺资源,被黄牛炒至175美元。Sora既带来全民狂欢,也引发OpenAI内部争议。
小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat,自研流式 pVAD 与 EoT 让语音交互更加自然,首发级联与半级联两套实现,端到端时延逼近工业级应用。
一名60岁老人,照着ChatGPT的建议戒盐养生,三个月后却被送进精神病院?更离奇的是,他不是唯一因为AI入院。「AI精神病」正在悄悄蔓延。医生、研究者、AI公司都开始警觉。我们,是否也正在其中? 一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发
AI 能成为合格的旅行搭子了吗?虽然笔者不建议任何人这么做,但这阵子笔者进行了一次极限尝试————什么攻略都不提前查,就靠 AI,看看一趟出国旅行能走到哪里。笔者选择了一款叫 AI 旅行助手的 app 来进行了我的主尝试,它号称不仅能替用户生成旅行攻略,还能在行程中帮忙预订餐厅、酒店。