AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

即插即用,完美兼容:SD社区的图生视频插件I2V-Adapter来了

图像到视频生成(I2V)任务旨在将静态图像转化为动态视频,这是计算机视觉领域的一大挑战。其难点在于从单张图像中提取并生成时间维度的动态信息,同时确保图像内容的真实性和视觉上的连贯性。大多数现有的 I2V 方法依赖于复杂的模型架构和大量的训练数据来实现这一目标。

来自主题: AI资讯
6286 点击    2024-01-14 14:39
超暖心!江财这个团队研发出AI助盲系统!

超暖心!江财这个团队研发出AI助盲系统!

超暖心!江财这个团队研发出AI助盲系统!

随着科技的发展,许多盲人正在借助AI提供的感知、理解与交互功能,以另一种方式重新感知世界。日前,我校软件与物联网工程学院创客荟团队研发了一款模拟触感交互控制的助盲系统,该系统通过AI技术,为盲人朋友学习带来了福音。

来自主题: AI资讯
7302 点击    2024-01-13 11:03
生物技术敲开新大门:蛋白质设计的AI时刻

生物技术敲开新大门:蛋白质设计的AI时刻

生物技术敲开新大门:蛋白质设计的AI时刻

这一年来,人工智能在多个领域大放异彩。从聊天机器人程序ChatGPT到AI绘画,从机器视觉到AI芯片,AI展现了革新各个行业的巨大潜力。

来自主题: AI资讯
5238 点击    2024-01-12 10:35
八问Canva:在AI时代称王还是落败?

八问Canva:在AI时代称王还是落败?

八问Canva:在AI时代称王还是落败?

Canva已经从低门槛设计工具成长为整套视觉生产力工具。

来自主题: AI资讯
2071 点击    2024-01-11 12:41
国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了

国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了

国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了

LAMM (Language-Assisted Multi-Modal) 旨在建设面向开源学术社区的多模态指令微调及评测框架,其包括了高度优化的训练框架、全面的评测体系,支持多种视觉模态。

来自主题: AI资讯
4913 点击    2024-01-11 11:43
专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能

专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能

专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能

在 AI 领域,近年来各个子领域都逐渐向 transformer 架构靠拢,只有文生图和文生视频一直以 diffusion + u-net 结构作为主流方向。diffusion 有更公开可用的开源模型,消耗的计算资源也更少。

来自主题: AI资讯
6350 点击    2024-01-06 12:27
让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接

让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接

让机器人感知你的「Here you are」,清华团队使用百万场景打造通用人机交接

来自清华大学交叉信息研究院的研究者提出了「GenH2R」框架,让机器人学习通用的基于视觉的人机交接策略这种可泛化策略使得机器人能更可靠地从人们手中接住几何形状多样、运动轨迹复杂的物体,为人机交互提供了新的可能性。

来自主题: AI资讯
5279 点击    2024-01-04 13:42
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V的开源替代方案来了!极低成本,性能却类似,清华、浙大等中国顶尖学府,为我们提供了性能优异的GPT-4V开源平替。

来自主题: AI资讯
7792 点击    2024-01-03 13:50