
爆火出圈!120秒克隆数字人,奥黛丽·赫本等已故明星遗产管理方钟情的AI视频神器,让视频创作像发推文一样简单
爆火出圈!120秒克隆数字人,奥黛丽·赫本等已故明星遗产管理方钟情的AI视频神器,让视频创作像发推文一样简单Argil采用SOTA deepfake模型的AI数字人技术,专为当今以视频为中心的环境而量身定制,旨在推广视频创作大众化,可满足创作者满足不断提高的质量标准的需求,而无需传统的时间和成本障碍。
Argil采用SOTA deepfake模型的AI数字人技术,专为当今以视频为中心的环境而量身定制,旨在推广视频创作大众化,可满足创作者满足不断提高的质量标准的需求,而无需传统的时间和成本障碍。
自回归文生图,迎来新王者——
我们实测16个Prompt:生成速度比Sora还快,动漫效果行业SOTA。
Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。
研究团队在最新时间序列预测基准评测TFB的25个数据集上进行了广泛验证,证明了DUET的卓越性能,为各行业的时间序列预测任务提供了全新的解决方案。
Hyper-YOLO是一种新型目标检测方法,通过超图计算增强了特征之间的高阶关联,提升了检测性能,尤其在识别复杂场景下的中小目标时表现更出色。
PaliGemma 2在多个任务上取得了业界领先的成绩,包括图像描述、乐谱识别和医学图像报告生成;并且提供了不同尺寸和分辨率的版本,用户可以根据不同的任务需求进行微调,以获得更好的性能。
为了构建鲁棒的 3D 机器人操纵大模型,Lift3D 系统性地增强 2D 大规模预训练模型的隐式和显式 3D 机器人表示,并对点云数据直接编码进行 3D 模仿学习。Lift3D 在多个仿真环境和真实场景中实现了 SOTA 的操纵效果,并验证了该方法的泛化性和可扩展性。
华中科技大学研发的UniSeg3D算法,能一次性完成三维场景中的六项分割任务,提升了场景理解的全面性和效率。通过任务间的信息共享,优化了性能,为虚拟现实和机器人导航等领域带来新的解决方案。
用大模型“蒸馏”小模型,有新招了!