AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
从今天起,ChatGPT会记住每一位付费用户

从今天起,ChatGPT会记住每一位付费用户

从今天起,ChatGPT会记住每一位付费用户

现在,ChatGPT记忆功能,向所有Plus用户开放!

来自主题: AI技术研报
3446 点击    2024-05-01 12:32
在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自主题: AI技术研报
7232 点击    2024-04-30 18:28
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。

来自主题: AI技术研报
8450 点击    2024-04-30 17:48
具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

ChatGPT-4 被认为是人工智能技术发展的重要节点,语言大模型之后的多模态大模型初步显现了世界模型的影子。大模型最终将通过硬件与物理世界产生交互。人工智能的应用实现从数字世界到物理世界的扩展,具身智能是非常关键的技术方向。

来自主题: AI技术研报
7095 点击    2024-04-30 17:43
打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

每一次关键技术取得通用化的突破,都会深刻改变生产方式,并显著提升生产力水平,而「大模型」成为了打通人工智能技术通用性「任督二脉」的关键。智慧眼,作为全球领先的人工智能企业,最近推出了其创新研发的通用大模型——砭石。

来自主题: AI技术研报
2693 点击    2024-04-30 17:35
黄仁勋“人肉快递”,掀起900亿美元算力争夺战

黄仁勋“人肉快递”,掀起900亿美元算力争夺战

黄仁勋“人肉快递”,掀起900亿美元算力争夺战

全球首台,黄仁勋亲自送货上门,OpenAI首发,DGX H200算是把流量拉满了。

来自主题: AI技术研报
8381 点击    2024-04-30 17:18
苹果紧急下架,这种一键除衣的AI,太逆天了

苹果紧急下架,这种一键除衣的AI,太逆天了

苹果紧急下架,这种一键除衣的AI,太逆天了

时间倒回前几年,如果小雷和小伙伴们聊聊AI,你们可能觉得我在天方夜谭?

来自主题: AI技术研报
11680 点击    2024-04-30 10:43
CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架,MoMask,正在让这一切变得可能。

来自主题: AI技术研报
8728 点击    2024-04-29 20:45
Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

来自主题: AI技术研报
8307 点击    2024-04-29 20:42
LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报
8829 点击    2024-04-29 20:31
全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

在4月27日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型Awaker 1.0,向AGI迈出至关重要的一步。

来自主题: AI技术研报
6959 点击    2024-04-29 20:27
Sora大片真相:人工特效参与,被指误导大众

Sora大片真相:人工特效参与,被指误导大众

Sora大片真相:人工特效参与,被指误导大众

啊?Sora火爆短片《气球人》,也“造假”了???

来自主题: AI技术研报
6719 点击    2024-04-29 20:11
国产GPU重大利好!“中国英伟达”千卡集群已就位

国产GPU重大利好!“中国英伟达”千卡集群已就位

国产GPU重大利好!“中国英伟达”千卡集群已就位

算力基础设施建设,北京市有了最新的大动作—— 《北京市算力基础设施建设实施方案(2024-2027年)》

来自主题: AI技术研报
6912 点击    2024-04-29 11:11
让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述

让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述

让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述

近期,大语言模型、文生图模型等大规模 AI 模型迅猛发展。在这种形势下,如何适应瞬息万变的需求,快速适配大模型至各类下游任务,成为了一个重要的挑战。受限于计算资源,传统的全参数微调方法可能会显得力不从心,因此需要探索更高效的微调策略。

来自主题: AI技术研报
10627 点击    2024-04-28 15:07
Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH

Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH

Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH

大模型力大砖飞,让LLaMA3演绎出了新高度: 超15T Token数据上的超大规模预训练,既实现了令人印象深刻的性能提升,也因远超Chinchilla推荐量再次引爆开源社区讨论。

来自主题: AI技术研报
8184 点击    2024-04-28 15:03
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

指代分割 (Referring Image Segmentation,RIS) 是一项极具挑战性的多模态任务,要求算法能够同时理解精细的人类语言和视觉图像信息,并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报
10455 点击    2024-04-28 13:46
吴恩达:多智能体协作是新关键,软件开发等任务将更高效

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

前不久,斯坦福大学教授吴恩达在演讲中提到了智能体的巨大潜力,这也引起了众多讨论。其中,吴恩达谈到基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。这表明,将目光局限于大模型不一定可取,智能体或许会比其所用的基础模型更加优秀。

来自主题: AI技术研报
11819 点击    2024-04-28 12:35
会颠勺的国产机器人来了:大模型加持,家务能力满分

会颠勺的国产机器人来了:大模型加持,家务能力满分

会颠勺的国产机器人来了:大模型加持,家务能力满分

随着 AI 向 AGI(通用人工智能)的圣杯方向加速发展,大模型与机器人的结合是必然趋势。数十年来,单一用途机器人市场已趋于饱和,AI 通用机器人的巨大潜力急待开垦。

来自主题: AI技术研报
7335 点击    2024-04-28 12:27
为什么要做长文本、长图文、长语音的大模型?深度解读讯飞星火V3.5春季上新

为什么要做长文本、长图文、长语音的大模型?深度解读讯飞星火V3.5春季上新

为什么要做长文本、长图文、长语音的大模型?深度解读讯飞星火V3.5春季上新

4 月 26 日,科大讯飞发布讯飞星火大模型 V3.5 的功能上新,其中一个重点就是面向用户各种场景中高效获取信息需求,发布首个长文本、长图文、长语音的大模型,能够支持文档、图文资料、会议录音等各种信息来源的快速理解和学习,还能够结合各种行业场景知识给出专业、准确回答。

来自主题: AI技术研报
8393 点击    2024-04-28 12:23