AI资讯新闻榜单内容搜索-视觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉
「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

趁着谷歌开大会,OpenAI果然又来定向狙击了。 谷歌前脚刚官宣一系列更新,OpenAI立马跟着抛出重大消息—— GPT-4 Turbo迎来「重大升级」!

来自主题: AI资讯
9256 点击    2024-04-11 16:48
离谱!AI超市「无人」收款,1000个印度人藏在背后……

离谱!AI超市「无人」收款,1000个印度人藏在背后……

离谱!AI超市「无人」收款,1000个印度人藏在背后……

就离谱,都2024了,人工智能靠人工的戏码还在上演。 而且是类似ATM机背后坐真·柜员给你递钱的那种!

来自主题: AI资讯
6246 点击    2024-04-10 13:40
工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

工业大模型也能图片、视频、CAD一键生成?「创新奇智」给出新思路

AInno-75B正式亮相,AI在视觉识别和工业设计领域的应用范围进一步拓宽。Chat GPT、Sora、Suno等AI技术的接连问世,让人类社会经历了一场认知的革命。世人开始意识到,AI不仅是单一的工具本身,更是推动人类文明进步的新引擎。在这个数据驱动、智能互联的时代,我们不禁发问:当AI的触角延伸到工业的每一个角落,它将如何重塑工业的未来?

来自主题: AI资讯
7578 点击    2024-04-09 11:26
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

EdgeNet可以处理从干净的自然图像或嘈杂的对抗性图像中提取的边缘,产生鲁棒的特征,具有轻量级、即插即用等特点,能够无缝集成到现有的预训练深度网络中,训练成本低。

来自主题: AI资讯
9609 点击    2024-04-08 16:17
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各个领域的实用性和灵活性,也为更多视觉场景下的应用探索了新的道路。

来自主题: AI技术研报
5247 点击    2024-04-08 15:49
二次元专用超分AI模型APISR:在线可用,入选CVPR

二次元专用超分AI模型APISR:在线可用,入选CVPR

二次元专用超分AI模型APISR:在线可用,入选CVPR

《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分,它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候,我们会突然有重温这些童年回忆的冲动,但我们却可能会略带遗憾地发现这些童年回忆的分辨率非常低,根本无法在客厅的 4K 大屏电视上创造出良好的视觉体验,以至于可能阻碍我们与在高分辨率数字世界中成长的孩子分享这些童年回忆。

来自主题: AI技术研报
7418 点击    2024-04-07 17:46
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。

来自主题: AI技术研报
3905 点击    2024-04-07 17:46
中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。

来自主题: AI技术研报
5111 点击    2024-04-07 13:10
李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席

「这是自 Karpathy 和我 2015 年启动这门课程以来的第 9 个年头,这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。

来自主题: AI资讯
5410 点击    2024-04-05 15:04