AI资讯新闻榜单内容搜索-框架

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 框架
「有效上下文」提升20倍!DeepMind发布ReadAgent框架

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

模仿人类阅读过程,先分段摘要再回忆,谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能,有效上下文提升了3-20倍。

来自主题: AI技术研报
8467 点击    2024-04-06 14:48
论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。

论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。

论文解读丨AI 争夺继承权?AgentGroupChat,为 AI 群聊打造的通用框架。

特工少女说:顾洲洪老师是复旦大学数据科学博士,最近新发表了一篇《AgentGroupChat: An Interactive Group Chat Simulacra For Better Eliciting Emergent Behavior》的论文,此文是顾老师自己对论文的解读,经授权转载自顾老师的知乎,点击文末阅读原文可跳转原文链接,学术交流可加文末顾老师的微信。

来自主题: AI技术研报
6307 点击    2024-04-06 13:58
谷歌更新Transformer架构,更节省计算资源!50%性能提升

谷歌更新Transformer架构,更节省计算资源!50%性能提升

谷歌更新Transformer架构,更节省计算资源!50%性能提升

谷歌终于更新了Transformer架构。最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计算模式。它通过动态分配大模型中的计算资源,跳过一些不必要计算,显著提高训练效率和推理速度。

来自主题: AI技术研报
8235 点击    2024-04-05 17:04
英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

英伟达开卷价格!最新Blackwell GPU架构/成本揭秘,彰显老黄的「仁慈」

【新智元导读】老黄新GPU深夜炸场,超高规格的背后也付出了不小的代价,小编带大家深入了解一下新架构的硬件细节和成本,新显卡的售价究竟高不高?英伟达也不得不开始卷了

来自主题: AI技术研报
8406 点击    2024-04-02 15:54
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

CLIP长文本能力被解锁,图像检索任务表现显著提升!一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。

来自主题: AI技术研报
9985 点击    2024-04-01 11:26
此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

现在,AI 大模型已经疯狂到这种地步了吗?此时此刻,正有两个 Claude 模型在无休止地对话,它们在探索整个宇宙的奥妙。

来自主题: AI资讯
8337 点击    2024-03-31 14:59
CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练一个 243 帧的 VPT 模型通常需要花费好几天的时间,严重拖慢了研究的进度,并成为了该领域亟待解决的一大痛点。

来自主题: AI技术研报
8552 点击    2024-03-31 14:44
Mamba架构第一次做大!混合Transformer,打败Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名字叫Jamba。

来自主题: AI技术研报
7624 点击    2024-03-30 14:01
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。

来自主题: AI资讯
7244 点击    2024-03-27 11:12