AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
虚幻5加持,清华发布首个「真实开放环境具身智能平台」与基准测试集EmbodiedCity!

虚幻5加持,清华发布首个「真实开放环境具身智能平台」与基准测试集EmbodiedCity!

虚幻5加持,清华发布首个「真实开放环境具身智能平台」与基准测试集EmbodiedCity!

基于虚幻引擎5,清华大学构建了一个真实、动态、开放的具身智能平台EmbodiedCity,用于评估和研究具身智能在复杂城市场景中的应用;该平台提供在线接入和离线运行两种使用方式,支持多模态场景理解、问答、对话、导航和任务规划等一系列具身智能任务。

来自主题: AI资讯
3010 点击    2024-10-12 14:23
Radical Ventures合伙人:挖掘Agents的四大重要创业机会

Radical Ventures合伙人:挖掘Agents的四大重要创业机会

Radical Ventures合伙人:挖掘Agents的四大重要创业机会

如果您正在探寻人工智能未来的辉煌篇章,那么答案就在这里。 OpenAI的领导者Sam Altman和Greg Brockman最近表示:“现在正是我们展望未来的最佳时机。”他们预见了一个新时代,用户将不再只是与单一的模型对话,而是与由众多多模态模型和工具构成的系统互动,这些系统能够代表用户执行操作。

来自主题: AI资讯
3481 点击    2024-10-09 11:06
OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

十一假期第1天, OpenAI一年一度的开发者大会又来了惹!今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办,刚刚结束的是第一场。

来自主题: AI资讯
3125 点击    2024-10-03 13:07
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。

来自主题: AI资讯
3231 点击    2024-10-02 11:17
长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

视觉数据的种类极其多样,囊括像素级别的图标到数小时的视频。现有的多模态大语言模型(MLLM)通常将视觉输入进行分辨率的标准化或进行动态切分等操作,以便视觉编码器处理。然而,这些方法对多模态理解并不理想,在处理不同长度的视觉输入时效率较低。

来自主题: AI资讯
3076 点击    2024-09-29 14:44
【行业前沿】多模态生成式AI助手在人类病理学中的应用

【行业前沿】多模态生成式AI助手在人类病理学中的应用

【行业前沿】多模态生成式AI助手在人类病理学中的应用

随着人工智能(AI)技术的飞速发展,特别是在生成式AI领域的突破,我们见证了许多新兴技术的诞生,它们正逐步改变着我们的生活和工作方式。

来自主题: AI资讯
7671 点击    2024-09-28 16:52