AI资讯新闻榜单内容搜索-Ai视频

走在GPT 4.5前面？3D、视频直接扔进对话框，大模型掌握跨模态推理

最近，有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示，和 GPT 系列之前推出的模型相比，GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像，还是能输入 3D 模型，目前只能靠猜。

来自主题: AI技术研报

6251 点击 2023-12-17 19:41

阿里文生视频挑战Gen-2、Pika，1280×720分辨率无压力，3500万文本-视频对显奇效

文生视频可以精细到什么程度？最近，阿里巴巴的一项研究给出了答案：1280×720 分辨率没有压力，而且生成效果非常连贯。

来自主题: AI资讯

7129 点击 2023-12-16 16:34

Pika想干掉Runway，AI视频生成有多卷？‍‍‍‍‍‍‍‍

AI 视频生成有多卷？‍‍‍‍‍‍‍‍最近 Pika 的火热，重新带动了人们对 AI 视频生成的关注，甚至带动创始人父亲的上市公司接连涨停。

来自主题: AI资讯

8641 点击 2023-12-15 12:00

Pika爆火，但AI视频还没到「GPT时刻」

今年10月，《时代》杂志发布了一份「2023最佳发明」榜单，为了呼应AI浪潮，《时代》从去年开始就特别设置了「AI单元」。在今年入选的十几个应用中，排在老牌软件巨头Adobe和屠龙少年OpenAI之后的就是大火的文生视频应用——Runway Gen-2。

来自主题: AI资讯

8457 点击 2023-12-14 10:22

随意指定CLIP关注区域！上交复旦等发布Alpha-CLIP：同时保持全图+局部检测能力

本文介绍了一个名为Alph-CLIP的框架，它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后，Alpha-CLIP可以在保证CLIP原始感知能力的前提下，关注到任意指定区域。通过替换原始CLIP的应用场景，Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。

来自主题: AI资讯

9192 点击 2023-12-13 16:14