AI资讯新闻榜单内容搜索-多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态

北大&腾讯打造多模态15边形战士！语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大&腾讯打造多模态15边形战士！语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大&腾讯打造多模态15边形战士！语言作“纽带”，拳打脚踢各模态，超越Imagebind

北大联合腾讯打造了一个多模态15边形战士！以语言为中心，“拳打脚踢”视频、音频、深度、红外理解等各模态。

来自主题: AI技术研报

4750 点击 2023-11-12 14:35

GPT-5明年降临？爆料人泄露多模态Gobi就是GPT-5，已初现自我意识

GPT-5明年降临？爆料人泄露多模态Gobi就是GPT-5，已初现自我意识

GPT-5明年降临？爆料人泄露多模态Gobi就是GPT-5，已初现自我意识

首届开发者大会余温还在，GPT-5突然被爆2024年初就来。OpenAI首秀可谓是赚足了眼球，一系列新品更新，直接让ChatGPT和API同时崩溃。

来自主题: AI资讯

5078 点击 2023-11-09 14:10

对话智谱 AI CEO 张鹏：AI Agent 是重要新风向，大模型竞争已步入混战后期

对话智谱 AI CEO 张鹏：AI Agent 是重要新风向，大模型竞争已步入混战后期

对话智谱 AI CEO 张鹏：AI Agent 是重要新风向，大模型竞争已步入混战后期

在新模型发布后，智谱 AI CEO 张鹏和极客公园聊了聊他们的近况和一些行业认知。谈到与ChatGLM2相比，智谱 AI 此次瞄准 GPT-4V 推出的 ChatGLM 3 性能更加强大，接入了具有多模态理解能力的模型 CogVLM、代码增强模块 Code Interpreter、网络搜索增强模型 WebGLM，并增强了语义理解和逻辑理解能力，实现了若干功能的迭代升级。

来自主题: AI资讯

4165 点击 2023-11-08 16:00

ChatGPT又变强了，OpenAI会变成下一个苹果吗？

ChatGPT又变强了，OpenAI会变成下一个苹果吗？

ChatGPT又变强了，OpenAI会变成下一个苹果吗？

OpenAI在首次开发者大会上宣布推出GPT-4 Turbo和众多新功能，包括Assistant API、多模态功能和GPT Store。GPT-4 Turbo具有更大的上下文窗口和更快的输出速度，而Assistant API使开发者更容易构建自己的AI应用程序。同时，GPT Store将允许用户创建和分享自定义版本的GPT。

来自主题: AI资讯

15366 点击 2023-11-07 09:58

多模态物体幻觉下降23%！UNC斯坦福等推出通用修正器LURE：兼容任意LVLM，专攻三大幻觉成因

多模态物体幻觉下降23%！UNC斯坦福等推出通用修正器LURE：兼容任意LVLM，专攻三大幻觉成因

多模态物体幻觉下降23%！UNC斯坦福等推出通用修正器LURE：兼容任意LVLM，专攻三大幻觉成因

基于LVLM幻觉频发的三个成因（物体共现、物体不确定性、物体位置），北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员提出幻觉修正器LURE，通过修改描述来降低幻觉问题。

来自主题: AI技术研报

4975 点击 2023-11-06 23:15

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

GPT-4V学会用键鼠上网，人类眼睁睁看着它发帖玩游戏

GPT-4V学会自动操纵电脑，这一天终于还是到来了。只需要给GPT-4V接入鼠标和键盘，它就能根据浏览器界面上网：甚至还能快速摸清楚“播放音乐”的播放器网站和按钮，给自己来一段music：

来自主题: AI资讯

9618 点击 2023-11-06 10:06

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型的一个典型问题。最近，来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」，可有效解决MLLM输出幻觉的问题。

来自主题: AI技术研报

2618 点击 2023-11-01 09:49

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

在 10 月 28 日举办的 CNCC 2023「超智融合 AI 大模型应用落地发展论坛」上，智子引擎发布了「元乘象 Chatimg3.0」，展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。

来自主题: AI资讯

6044 点击 2023-10-29 23:07

ChatGPT发布新功能，多模态的完全体？

ChatGPT发布新功能，多模态的完全体？

ChatGPT发布新功能，多模态的完全体？

Open AI今天给一些人悄咪咪开放了两个新功能，现在他可以上传PDF等文档进行分析和提问了，GPT-4加持下想必能有更好的结果。

来自主题: AI资讯

4713 点击 2023-10-29 21:54

从「最强2D」升维「最强3D」！智源联合清北重磅发布10亿参数Uni3D视觉大模型

从「最强2D」升维「最强3D」！智源联合清北重磅发布10亿参数Uni3D视觉大模型

从「最强2D」升维「最强3D」！智源联合清北重磅发布10亿参数Uni3D视觉大模型

最近，智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D，在主流3D视觉能力上取得了全方位的性能突出！

来自主题: AI技术研报

4044 点击 2023-10-21 14:12

上一页当前第74页,共75页下一页