AI资讯新闻榜单内容搜索-计算机视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 计算机视觉
李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

「这是自 Karpathy 和我 2015 年启动这门课程以来的第 9 个年头,这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。

来自主题: AI资讯
5357 点击    2024-04-05 15:04
比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发展带来了巨大困难。面对这一挑战,原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2],带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩,将微调技术带进千家万户。

来自主题: AI技术研报
8207 点击    2024-04-01 15:45
教授何恺明在MIT的第一堂课

教授何恺明在MIT的第一堂课

教授何恺明在MIT的第一堂课

作为麻省理工学院(MIT)电气工程与计算机科学系(EECS)副教授,何恺明第一节课讲授了卷积神经网络的基本知识。

来自主题: AI资讯
7329 点击    2024-03-09 15:02
语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转变为只需有限的明确指令就能完成各种任务的通用模型

来自主题: AI技术研报
4054 点击    2024-02-15 21:45
首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024

首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024

首个通用双向Adapter多模态目标追踪方法BAT,入选AAAI 2024

目标跟踪是计算机视觉的一项基础视觉任务,由于计算机视觉的快速发展,单模态 (RGB) 目标跟踪近年来取得了重大进展。考虑到单一成像传感器的局限性,我们需要引入多模态图像 (RGB、红外等) 来弥补这一缺陷,以实现复杂环境下全天候目标跟踪。

来自主题: AI技术研报
9510 点击    2024-01-24 14:10
即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息,同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一目标。

来自主题: AI资讯
6223 点击    2024-01-14 14:39
计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能做对图形推理题,AGI火花再次出现了?计算机视觉的GPT时刻,来了!

来自主题: AI资讯
6043 点击    2023-12-04 18:15
人工智能初创公司BeSuperhuman.ai利用突破性的计算机视觉模型革新人机交互方式

人工智能初创公司BeSuperhuman.ai利用突破性的计算机视觉模型革新人机交互方式

人工智能初创公司BeSuperhuman.ai利用突破性的计算机视觉模型革新人机交互方式

BeSuperhuman.ai是一家计算机视觉人工智能初创公司,这家公司准备用突破性的新型视觉推理LLM模型,来颠覆AI工作助手的工作模式,以及我们过往操作电脑工具的交互方式。

来自主题: AI资讯
3687 点击    2023-10-24 23:23