AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
Bifröst:基于语言指令的3D感知图像合成技术

Bifröst:基于语言指令的3D感知图像合成技术

Bifröst:基于语言指令的3D感知图像合成技术

Bifröst 是一个创新的3D感知图像合成框架,它利用扩散模型来执行基于语言指令的图像合成任务。

来自主题: AI技术研报
4613 点击    2024-11-05 19:29
RAG 系统的分块难题:小型语言模型如何找到最佳断点?

RAG 系统的分块难题:小型语言模型如何找到最佳断点?

RAG 系统的分块难题:小型语言模型如何找到最佳断点?

之前我们聊过 RAG 里文档分块 (Chunking) 的挑战,也介绍了 迟分 (Late Chunking) 的概念,它可以在向量化的时候减少上下文信息的丢失。今天,我们来聊聊另一个难题:如何找到最佳的分块断点。

来自主题: AI技术研报
5505 点击    2024-11-05 16:36
无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型(如 GPT-4o、DALL-E 3)通常拥有数十亿参数,且模型权重不公开,使得传统的白盒优化方法(如反向传播)难以实施。

来自主题: AI技术研报
2694 点击    2024-11-05 15:28
1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

1000个智能体打造《我的世界》,北大校友35页技术报告揭秘

北大校友打造的1000个智能体「我的世界」,背后原理揭晓了! 团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

来自主题: AI技术研报
2935 点击    2024-11-05 15:17
视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024

SegVG是一种新的视觉定位方法,通过将边界框注释转化为像素级分割信号来增强模型的监督信号,同时利用三重对齐模块解决特征域差异问题,提升了定位准确性。实验结果显示,SegVG在多个标准数据集上超越了现有的最佳模型,证明了其在视觉定位任务中的有效性和实用性。

来自主题: AI技术研报
3086 点击    2024-11-05 14:56
无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

无需训练即可大幅提升SAM 2!开源的SAM2Long来了,港中文、上海AI Lab出品

Segment Anything Model 2(SAM 2)在传统视频目标分割任务大放异彩,引起了众多关注。然而,港中文和上海 AI Lab 的研究团队发现 SAM 2 的贪婪选择策略容易陷入「错误累积」的问题,即一次错误的分割掩码选择将影响后续帧的分割结果,导致整个视频分割性能的下降。这个问题在长视频分割任务中显得更加严重。

来自主题: AI技术研报
7242 点击    2024-11-05 14:53