
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包日前,旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。
日前,旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。
6月中旬,Iambic Therapeutics宣布完成超额认购的5000万美元B轮融资,由新投资者 Mubadala Capital 和 Exor Ventures 领投,卡塔尔投资局 (QIA) 以及老股东Abingworth、Illumina Ventures、Nexus Venture Partners、Coatue 和 Tao Capital Partners 参投。
3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D资产的一个重要类别,服装资产的往往来源于平面板片与物理模拟等流程,而不是直接在3D上建模。
大模型执行图推理任务,我们是希望大模型仅仅给出结果,还是在给出准确答案的同时,输出详细的推理过程?
使用大模型合成的数据,就能显著提升3D生成能力?
最少只需1个3D样例,即可生成3D主题乐园。
图学习领域的数据饥荒问题,又有能缓解的新花活了!
对于普通人来说,写一首歌是一件难事: 作词、作曲、编曲、录制这套流程下来,不仅要有乐理知识,也要对各个乐器的理解度,而且对于设备的要求也很高。
图是组织信息的一种有用方式,但LLMs主要是在常规文本上训练的。谷歌团队找到一种将图转换为LLMs可以理解的格式的方法,显著提高LLMs在图形问题上超过60%的准确性。
港大发布通用图基座模型OpenGraph,巧妙从LLM中蒸馏零样本图泛化能力。