AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
OpenAI和谷歌AI多模态重磅更新,生成式AI之战升级第二轮

OpenAI和谷歌AI多模态重磅更新,生成式AI之战升级第二轮

OpenAI和谷歌AI多模态重磅更新,生成式AI之战升级第二轮

ChatGPT以及硅谷AI大战终于升级,长出了“眼睛”和“嘴”。5月中旬,OpenAI和谷歌前后发布重磅AI多模态更新,从基于文字交互的ChatGPT全面升级,实现了“声音,文字和视觉”三者全面结合的人工智能新交互功能,而这,也标志着硅谷科技巨头的生成式AI之战正式进入到第二轮。新一轮竞争,只会更加激烈、更加全面。

来自主题: AI资讯
8442 点击    2024-05-20 09:57
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。

来自主题: AI技术研报
8471 点击    2024-05-19 16:01
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

GPT-4o发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta团队发布了「混合模态」Chameleon,可以在单一神经网络无缝处理文本和图像。10万亿token训练的34B参数模型性能接近GPT-4V,刷新SOTA。

来自主题: AI技术研报
8637 点击    2024-05-19 15:48
多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

许多临床任务需要了解专业数据,例如医学图像、基因组学,这类专业知识信息在通用多模态大模型的训练中通常不存在。

来自主题: AI资讯
5092 点击    2024-05-18 19:09
HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。

来自主题: AI技术研报
10204 点击    2024-05-17 17:49
国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

国内外140+大模型、8万+考题测评结果出炉!智源评测体系出品

2024年5月17日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。

来自主题: AI资讯
10003 点击    2024-05-17 17:25
蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明

蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明

蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明

与之前的版本相比,GPT-4o最大改进在于它在整合方面的精细度,它将所有模态集成在一个端到端的模型中(All in One)。

来自主题: AI技术研报
5640 点击    2024-05-15 21:51
OpenAI 重磅发布 GPT-4o :见证《Her》的诞生!

OpenAI 重磅发布 GPT-4o :见证《Her》的诞生!

OpenAI 重磅发布 GPT-4o :见证《Her》的诞生!

北京时间 5 月 14 日凌晨,备受期待的 OpenAI 春季更新发布会上,CTO Mira Murati 宣布发布新的模型迭代版本——GPT-4o,o 代表「omnimodel」(全能模型),原生多模态,改进了文本、视觉和音频的能力。

来自主题: AI资讯
4166 点击    2024-05-14 21:47
OpenAI教谷歌做语音助手,新模型GPT-4o科幻级语音交互,零延迟满情绪,AI进入HER时代

OpenAI教谷歌做语音助手,新模型GPT-4o科幻级语音交互,零延迟满情绪,AI进入HER时代

OpenAI教谷歌做语音助手,新模型GPT-4o科幻级语音交互,零延迟满情绪,AI进入HER时代

5月14日凌晨,OpenAI终于发布了Sam Altman提前造势的“Magic(魔法)”,主要包括三个重点发布,ChatGPT新UI、桌面版GPT、以及最重要的,新的多模态模型GPT-4o。

来自主题: AI资讯
9942 点击    2024-05-14 19:18