AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
实测丨当 o1 pro 遇上最权威的智商测试,结果竟然是……

实测丨当 o1 pro 遇上最权威的智商测试,结果竟然是……

实测丨当 o1 pro 遇上最权威的智商测试,结果竟然是……

前天 OpenAI 发布了最强的 o1 pro mode 模型,而 pricing 随之提高到了 $200/月。特工成员果断地付款后,选取了门萨IQ测试题来全面分析 o1 pro 在视觉模式识别与逻辑推理任务上的表现。

来自主题: AI技术研报
9205 点击    2024-12-09 10:03
语言已显苍白,欢迎着陆AI大世界模型

语言已显苍白,欢迎着陆AI大世界模型

语言已显苍白,欢迎着陆AI大世界模型

作为计算机视觉领域的开拓者,李飞飞在人工智能革命中扮演了重要角色。她的新回忆录《我所看到的世界》(The Worlds I See)详细讲述了她从学术到技术突破的旅程,以及如何在人工智能的最前沿找到自己的使命。

来自主题: AI资讯
6427 点击    2024-12-08 12:14
用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

用LLaVA解读数万神经元,大模型竟然自己打开了多模态智能黑盒

以 GPT4V 为代表的多模态大模型(LMMs)在大语言模型(LLMs)上增加如同视觉的多感官技能,以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧,但迄今为止,我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报
6094 点击    2024-12-07 15:02
三大AI顶流,争着“造世界”

三大AI顶流,争着“造世界”

三大AI顶流,争着“造世界”

当前构建数字世界有三条路线:OpenAI的Sora追求视觉真实,谷歌的Genie 2注重实时交互,World Labs专注空间准确。这三条路线各有优势,也各有无法在短期内解决的问题。

来自主题: AI资讯
7034 点击    2024-12-06 09:44
ShowUI:当前最好的 UI Agent 开源模型?

ShowUI:当前最好的 UI Agent 开源模型?

ShowUI:当前最好的 UI Agent 开源模型?

Show Lab 和微软推出 ShowUI,这是一个刚刚开源的 UI Agent 模型,在中文 APP 定位和导航能力上表现出色。通过创新的视觉 token 选择和独特的训练数据构建方法,该模型在有限的训练数据下实现了非常棒的性能。

来自主题: AI技术研报
7649 点击    2024-12-06 09:41
AI视觉领域明星「Luma AI」完成9000万美元融资,亚马逊、AMD、韩华投了

AI视觉领域明星「Luma AI」完成9000万美元融资,亚马逊、AMD、韩华投了

AI视觉领域明星「Luma AI」完成9000万美元融资,亚马逊、AMD、韩华投了

《智能涌现》获悉,美国硅谷AI视觉领域企业“Luma AI”近日完成新一轮融资,金额为9000万美元。《智能涌现》获悉,美国硅谷AI视觉领域企业“Luma AI”近日完成新一轮融资,金额为9000万美元。

来自主题: AI资讯
5163 点击    2024-12-06 09:18
商汤完成组织调整 | 智涌独家

商汤完成组织调整 | 智涌独家

商汤完成组织调整 | 智涌独家

智能涌现独家获悉,12月3日晚间,商汤科技董事长&CEO徐立发布内部信,宣布商汤科技已完成战略重组,未来将聚焦核心业务AI云以及通用视觉模型,智能汽车”绝影”、家庭机器人“元萝卜”、智慧医疗、智慧零售等业务将拆分为独立公司,各设独立CEO。

来自主题: AI资讯
6211 点击    2024-12-04 09:55
轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品

轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品

轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品

浙大、腾讯优图、华中科技大学的团队,提出轻量化MobileMamba! 既良好地平衡了效率与效果,推理速度远超现有基于Mamba的模型。

来自主题: AI技术研报
7321 点击    2024-12-01 14:27
关于计算机视觉中的自回归模型,这篇综述一网打尽了

关于计算机视觉中的自回归模型,这篇综述一网打尽了

关于计算机视觉中的自回归模型,这篇综述一网打尽了

随着计算机视觉领域的不断发展,自回归模型作为一种强大的生成模型,在图像生成、视频生成、3D 生成和多模态生成等任务中展现出了巨大的潜力。然而,由于该领域的快速发展,及时、全面地了解自回归模型的研究现状和进展变得至关重要。本文旨在对视觉领域中的自回归模型进行全面综述,为研究人员提供一个清晰的参考框架。

来自主题: AI技术研报
7152 点击    2024-12-01 14:21
Chroma出售给AI人工智能音频公司 Bronze

Chroma出售给AI人工智能音频公司 Bronze

Chroma出售给AI人工智能音频公司 Bronze

Chroma,一家致力于为移动设备打造新型音频视觉娱乐的初创公司。

来自主题: AI资讯
2775 点击    2024-11-29 16:36