速递|Era融资1100万美元,为AI硬件设备构建智能编排软件层
速递|Era融资1100万美元,为AI硬件设备构建智能编排软件层Era平台允许硬件制造商为 AI 设备创建 AI 智能体和编排。该公司并不打算自己制造设备,而是旨在通过提供一个软件层来赋能他人,该软件层可以处理诸如定制语音创建或为耳机等传统设备添加智能等任务。
Era平台允许硬件制造商为 AI 设备创建 AI 智能体和编排。该公司并不打算自己制造设备,而是旨在通过提供一个软件层来赋能他人,该软件层可以处理诸如定制语音创建或为耳机等传统设备添加智能等任务。
AI心理疗愈赛道正在越来越多地获得资本青睐。a16z投资的Ash估值2.2亿美元,主打AI心理教练的Wysa用户量超600万,MIT团队打造的AI治疗师Sonia获得YC投资。偏向于严肃医疗的心理健康平台Grow Therapy近期官宣了由红杉、高盛等参投的D轮融资,估值30亿美元。
今天凌晨,Physical Intelligence发布了全新的VLA模型π0.7,狠狠敲了世界模型一记闷棍。π0.7第一次在机器人领域证明了Compositional Generalization(组合泛化),且VLA。
最近,具身智能圈被 Generalist CEO 的一篇长文《Going Beyond World Models & VLAs》刷屏。文章抛出了一个看似振聋发聩的观点:目标远比工具标签更重要。与其陷入 “我们到底是在做 VLA(视觉 - 语言 - 动作模型)还是世界模型(World Model)” 的教条之争,不如回归本源:让机器高效、准确地作用于物理世界。
这个月,具身智能领域又卷出新高度:硅谷独角兽公司 Generalist AI 发布全新一代基础模型 GEN-1,将机器人包装手机、折纸箱这些活的平均成功率直接拉到了创纪录的 99%,折纸箱的速度更是飙到了以前的三倍(34s vs 12.1s)。
近日,上海人工智能实验室联合南京大学、香港中文大学及上海交通大学,将OpenClaw的成功应用于多模态生成领域。他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。
最近,计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。
最近,来自Meta与University of Copenhagen的研究者提出了OneStory: Coherent Multi-Shot Video Generation with Adaptive Memory(收录于CVPR 2026)。这项工作聚焦于一个核心问题:如何在生成多镜头视频时,有效保留长程跨镜头上下文,从而实现更强的叙事一致性。
Generalist AI的GEN-1热度,仍在发酵。
语音合成大家都不陌生,这两年市面上各种AI配音也层出不穷。