全球首个人形机器人通用视觉感知系统,Humanoid Occupancy建立多模态环境理解新范式
全球首个人形机器人通用视觉感知系统,Humanoid Occupancy建立多模态环境理解新范式凭借类人化的结构设计与运动模式,人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域,而这些任务的高效完成,均以机器人对自身所处环境的全面精准理解为前提。
凭借类人化的结构设计与运动模式,人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域,而这些任务的高效完成,均以机器人对自身所处环境的全面精准理解为前提。
就在刚刚,Higgsfiled AI推出Motion Controls AI视频生成,在模仿电影级别的动作捕捉删上取得了新进展!不论是是360度环绕拍摄还是子弹时间都是信手拈来,从此就像口袋里装着一个「摄影组」,电影级别的画面也可以由AI代劳。
双人动作生成新SOTA!
轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。研究人员提出了MagicMotion,一种创新的图像到视频生成框架,共同第一作者为复旦大学研究生李全昊、邢桢,通讯作者为复旦大学吴祖煊副教授。
在当前竞争激烈的3D生成技术领域,众多科技巨头和创业公司纷纷入局,推动了技术的快速发展和应用。Cartwheel,通过其Text-to-Motion技术和自动化运动合成,为3D角色制作带来革命性的简化。
EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。
《智能涌现》获悉,AI视频生成科技公司“鹿影科技(Avolution.ai)”此前已完成天使轮融资,由蓝驰创投和红点中国参与投资。与此同时,鹿影科技正在启动新一轮融资,所得资金将主要用于技术和产品投入,以及团队建设。
无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。
想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架,MoMask,正在让这一切变得可能。
Gen-2“运动笔刷”(Motion Brush)官宣再进化!它现在的名叫“多头运动笔刷”(Multi Motion Brush),敲重点:“加量不加价”所有用户包含免费账户都能体验。