AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
“女儿概念股”效应:多模态或成AI应用胜负手

“女儿概念股”效应:多模态或成AI应用胜负手

“女儿概念股”效应:多模态或成AI应用胜负手

硅谷AI初创新星Pika爆火,不仅让“女儿概念股”信雅达收获两个涨停,还将这股暖风吹到了A股AI应用板块。12月1日(周五)午后,昆仑万维、万兴科技先后涨停,汤姆猫、福昕软件、国脉文化等多只个股强势上涨。

来自主题: AI资讯
7069 点击    2023-12-02 16:37
微软亚洲研究院韦福如:人工智能基础创新的第二增长曲线

微软亚洲研究院韦福如:人工智能基础创新的第二增长曲线

微软亚洲研究院韦福如:人工智能基础创新的第二增长曲线

从人工智能的发展历程来看,GPT 系列模型(例如 ChatGPT 和 GPT-4)的问世无疑是一个重要的里程碑。由它所驱动的人工智能应用已经展现出高度的通用性和可用性,并且能够覆盖多个场景和行业 —— 这在人工智能的历史上前所未有。

来自主题: AI技术研报
6800 点击    2023-12-01 15:00
最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了

最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了

最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了

目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,

来自主题: AI技术研报
10223 点击    2023-12-01 14:53
网易传媒携手北京协和医院,共研国际首个多模态AI癫痫样放电检测系统

网易传媒携手北京协和医院,共研国际首个多模态AI癫痫样放电检测系统

网易传媒携手北京协和医院,共研国际首个多模态AI癫痫样放电检测系统

网易垂类模型首度落地医疗临床领域,由网易传媒与北京协和医院强强合作、共同研发的国际首个多模态AI癫痫样放电检测系统vEpiSpy正式亮相第二十六届全国神经病学学术大会,并在北京协和医院、北京天坛医院、山东大学附属儿童医院等全国多家顶级三甲医院展开了临床试用。

来自主题: AI资讯
5490 点击    2023-12-01 14:36
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。

来自主题: AI资讯
6321 点击    2023-11-29 15:32
超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能

超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能

超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能

研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单上超越了其他同级模型。

来自主题: AI技术研报
9597 点击    2023-11-29 15:05
规模小、效率高:DeepMind推出多模态解决方案Mirasol 3B

规模小、效率高:DeepMind推出多模态解决方案Mirasol 3B

规模小、效率高:DeepMind推出多模态解决方案Mirasol 3B

性能优于规模更大的模型。多模态学习面临的主要挑战之一是需要融合文本、音频、视频等异构的模态,多模态模型需要组合不同来源的信号。然而,这些模态具有不同的特征,很难通过单一模型来组合。

来自主题: AI资讯
8978 点击    2023-11-28 15:06
我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造

我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造

我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造

由南洋理工华人团队新提出的80亿参数多模态大模型OtterHD,不仅可以搞定让GPT-4V都发愁的难题,甚至还可以数出来《清明上河图》(局部)里到底有多少只骆驼!

来自主题: AI资讯
9279 点击    2023-11-27 16:09
GPT-4不会图形推理?“放水”后准确率依然只有33%

GPT-4不会图形推理?“放水”后准确率依然只有33%

GPT-4不会图形推理?“放水”后准确率依然只有33%

GPT-4的图形推理能力,竟然连人类的一半都不到? 美国圣塔菲研究所的一项研究显示,GPT-4做图形推理题的准确率仅有33%。而具有多模态能力的GPT-4v表现更糟糕,只能做对25%的题目。

来自主题: AI技术研报
3842 点击    2023-11-21 12:44
「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR|NeurIPS 2023

「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR|NeurIPS 2023

「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR|NeurIPS 2023

C-MCR利用现有多模态对比表征间可能存在的重叠模态,来连接不同的对比表征,从而学到更多模态间的对齐关系,实现了在缺乏配对数据的多模态间进行训练。

来自主题: AI技术研报
2539 点击    2023-11-19 12:23