AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
6955 点击    2024-12-20 15:59
2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

2025年,AI Agent还会是风口吗?11个问题揭秘智能体技术发展全貌

经过了LLM、RAG、多模态等多轮技术风口的洗礼后,AI智能体的应用现状究竟如何?Langbase公司最近发布的调查报告通过11个关键问题,为我们提供了一份有价值的现状切面。

来自主题: AI资讯
8496 点击    2024-12-19 13:40
28年数据枯竭?AI炼出数据飞轮2.0,智能体+多模态数据湖硬核掘金

28年数据枯竭?AI炼出数据飞轮2.0,智能体+多模态数据湖硬核掘金

28年数据枯竭?AI炼出数据飞轮2.0,智能体+多模态数据湖硬核掘金

面对AI圈疯传的「数据如化石燃料一般正在枯竭」,我们该如何从海量数据中掘金?AI炼出的数据飞轮2.0,或许就是答案。

来自主题: AI资讯
5056 点击    2024-12-19 13:10
家居AI 2.0时代,居然设计家、酷家乐、欧派、百度们找到了哪些落地密码?

家居AI 2.0时代,居然设计家、酷家乐、欧派、百度们找到了哪些落地密码?

家居AI 2.0时代,居然设计家、酷家乐、欧派、百度们找到了哪些落地密码?

今年以来,家居行业正在不断推动AI大模型的技术提升与落地应用,比如群核科技发布了多模态CAD大模型;居然之家与火山引擎合作推动AI大模型、veOmniverse等技术的应用……

来自主题: AI资讯
7265 点击    2024-12-19 12:55
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。

来自主题: AI技术研报
6628 点击    2024-12-18 14:38
Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

Florence-VL 提出了使用生成式视觉编码器 Florence-2 作为多模态模型的视觉信息输入,克服了传统视觉编码器(如 CLIP)仅提供单一视觉表征而往往忽略图片中关键的局部信息。

来自主题: AI技术研报
7224 点击    2024-12-18 14:21