AI资讯新闻榜单内容搜索-Vide

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Vide
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了

Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了

Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了

OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。

来自主题: AI技术研报
7587 点击    2024-06-17 23:41
清华、华为等提出iVideoGPT:专攻交互式世界模型

清华、华为等提出iVideoGPT:专攻交互式世界模型

清华、华为等提出iVideoGPT:专攻交互式世界模型

iVideoGPT,满足世界模型高交互性需求。

来自主题: AI技术研报
9833 点击    2024-05-28 14:01
看透物体的3D表示和生成模型:NUS团队提出X-Ray

看透物体的3D表示和生成模型:NUS团队提出X-Ray

看透物体的3D表示和生成模型:NUS团队提出X-Ray

如今的生成式AI在人工智能领域迅猛发展,在计算机视觉中,图像和视频生成技术已日渐成熟,如Midjourney、Stable Video Diffusion [1]等模型广泛应用。然而,三维视觉领域的生成模型仍面临挑战。

来自主题: AI技术研报
4647 点击    2024-05-06 17:52
在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自主题: AI技术研报
6790 点击    2024-04-30 18:28
华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用

华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用

华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用

近期,一篇4万字的演讲风靡于国内人工智能(AI)学术圈。原华为"天才少年"、Logenic AI公司联合创始人李博杰博士,日前发表了一篇关于AI Agent思考的文章,题为"AI Agent 应该更有趣还是更有用"。

来自主题: AI资讯
8745 点击    2024-04-05 10:32
刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

AIGC,算是狠狠地震荡了一把音乐圈。就在刚刚,OpenAI官方账号发布的一支由Sora制作的MV(Music Video)——《Worldweight》,引发了不少网友们的围观。

来自主题: AI技术研报
8458 点击    2024-04-03 13:52
此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

现在,AI 大模型已经疯狂到这种地步了吗?此时此刻,正有两个 Claude 模型在无休止地对话,它们在探索整个宇宙的奥妙。

来自主题: AI资讯
7609 点击    2024-03-31 14:59