AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠

9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠

9大基准全面领先,性能暴涨10.8%!视觉价值模型VisVM成「图像描述」新宠

视觉价值模型(VisVM)通过「推理时搜索」来提升多模态视觉语言模型的图像描述质量,减少幻觉现象。实验表明,VisVM能显著提高模型的视觉理解能力,并可通过自我训练进一步提升性能。

来自主题: AI技术研报
8088 点击    2024-12-30 14:43
支付宝推出新一代AI视觉搜索产品“探一下”:用AI之眼探索万物

支付宝推出新一代AI视觉搜索产品“探一下”:用AI之眼探索万物

支付宝推出新一代AI视觉搜索产品“探一下”:用AI之眼探索万物

12月30日,支付宝推出新一代AI视觉搜索产品“探一下”,基于自研的多模态大模型技术,可“用AI之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。

来自主题: AI资讯
5137 点击    2024-12-30 14:05
AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

韦伯区位问题源自一个经典的运筹优化问题,它首先由著名数学家皮耶・德・费马提出,后被著名经济学家阿尔弗雷德・韦伯(著名社会学家马克斯・韦伯的弟弟)扩展,在机器学习、人工智能、金融工程及计算机视觉等众多领域均有广泛应用。

来自主题: AI技术研报
6462 点击    2024-12-30 13:45
视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

对抗攻击,特别是基于迁移的有目标攻击,可以用于评估大型视觉语言模型(VLMs)的对抗鲁棒性,从而在部署前更全面地检查潜在的安全漏洞。然而,现有的基于迁移的对抗攻击由于需要大量迭代和复杂的方法结构,导致成本较高

来自主题: AI技术研报
9079 点击    2024-12-28 14:01
理想同学App实测:车企造的AI应用,除了视觉,其他都很一般

理想同学App实测:车企造的AI应用,除了视觉,其他都很一般

理想同学App实测:车企造的AI应用,除了视觉,其他都很一般

2023年6月,理想汽车推出了自研认知大模型“Mind GPT”,它以“理想同学”App的形式出现在理想汽车的车机中,支持通过自然语言交流、发送指令。2024年,Mind GPT升级到3.0,带来了行业领先的自然语言任务执行功能。

来自主题: AI资讯
8393 点击    2024-12-28 12:11
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。

来自主题: AI技术研报
8767 点击    2024-12-28 11:41
豆包定价一元的野心:字节跳动打响AI突围战

豆包定价一元的野心:字节跳动打响AI突围战

豆包定价一元的野心:字节跳动打响AI突围战

在人工智能快速发展的当下,这个问题有了新的答案——处理284张720P的图片。2023年12月,随着字节跳动发布最新的豆包视觉理解模型,AI领域又迎来一次"降维打击":每千tokens的输入价格降至3厘,较行业常见价格低了整整85%。

来自主题: AI资讯
9210 点击    2024-12-27 12:55
AI到底有没有护城河?

AI到底有没有护城河?

AI到底有没有护城河?

前脚大模型六小虎之一的智谱刚完成新一轮30亿的融资;后脚字节跳动发布豆包视觉理解模型、快手可灵1.6正式上线。

来自主题: AI资讯
8337 点击    2024-12-26 09:31