AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。

来自主题: AI资讯
7244 点击    2024-03-27 11:12
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了

把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型?!日本大模型公司sakana.ai脑洞大开(正是“Transformer八子”之一所创办的公司),想出了这么一个进化合并模型的妙招。

来自主题: AI资讯
7934 点击    2024-03-25 18:33
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

去年 8 月,两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI,总部位于日本东京。

来自主题: AI资讯
7132 点击    2024-03-25 17:12
讨论下一个token预测时,我们可能正在走进陷阱

讨论下一个token预测时,我们可能正在走进陷阱

讨论下一个token预测时,我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。

来自主题: AI资讯
7144 点击    2024-03-25 17:05
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。

来自主题: AI资讯
11724 点击    2024-03-25 17:01
CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。

来自主题: AI资讯
2940 点击    2024-03-24 21:49
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora,该框架整合了几种先进的视觉 AI 智能体,以复制 Sora 所展示的通用视频生成能力。

来自主题: AI技术研报
5426 点击    2024-03-23 21:22
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

具身基础模型突破2D,全新生成式视觉-语言-行动模型3D-VLA,在多项任务中显著提高了推理、多模态生成和规划的能力。

来自主题: AI资讯
5406 点击    2024-03-23 13:42
CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦,其团队在 ICCV 2021 会议上发表过一项类似的研究:仅仅使用一个或数个手绘草图,即可以自定义一个现成的 GAN 模型,进而输出与草图匹配的图像。

来自主题: AI资讯
7407 点击    2024-03-21 18:32
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

3D 生成领域迎来新的「SOTA 级选手」,支持商用和非商用。Stability AI 的大模型家族来了一位新成员。昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Video 3D」(简称 SV3D)。

来自主题: AI技术研报
7574 点击    2024-03-20 16:10