AI资讯新闻榜单内容搜索-Anything

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Anything
无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

Segment Anything Model 2(SAM 2)在传统视频目标分割任务大放异彩,引起了众多关注。然而,港中文和上海 AI Lab 的研究团队发现 SAM 2 的贪婪选择策略容易陷入「错误累积」的问题,即一次错误的分割掩码选择将影响后续帧的分割结果,导致整个视频分割性能的下降。这个问题在长视频分割任务中显得更加严重。

来自主题: AI技术研报
8055 点击    2024-11-05 14:53
全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。

来自主题: AI技术研报
8540 点击    2024-10-18 10:53
GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

近日,字节跳动大模型团队开发的成果 Depth Anything V2 ,入选苹果公司 Core ML 模型库,目前已呈现在开发者相关页面中。

来自主题: AI技术研报
9232 点击    2024-07-11 20:20
小鹏公然AI“造假”,啧啧啧

小鹏公然AI“造假”,啧啧啧

小鹏公然AI“造假”,啧啧啧

来自小鹏汽车最新的一项研究——Anything in Any Scene。主打一个往真实环境里毫无违和感地“塞”进去任何东西。

来自主题: AI资讯
4842 点击    2024-02-08 14:05
纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了

纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了

纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了

人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计(MDE)。

来自主题: AI资讯
6477 点击    2024-01-23 15:13
阿里版“马良神笔”来了,轻轻一抹让蒙娜丽莎对你微笑

阿里版“马良神笔”来了,轻轻一抹让蒙娜丽莎对你微笑

阿里版“马良神笔”来了,轻轻一抹让蒙娜丽莎对你微笑

近半年来,文生视频、图生视频类的工具层出不穷,让人眼花缭乱。但不少实际体验过的用户一定会感受到,脑中的想法转化为语言尚且不易,而人类的语言复杂而精妙,想要再找到准确的提示词,让AI正确理解我们的意图,继而转换为图片和视频,实在是太难了。

来自主题: AI资讯
8024 点击    2024-01-13 20:15