AI资讯新闻榜单内容搜索-训练

「图结构学习」新思路！港大等提出GraphEdit模型：用LLM删除噪声边，全局理解节点间依赖关系

GraphEdit方法可以有效地去除图网络中的噪声连接，还能从全局视角识别节点间的依赖关系，在不同的实验设置中都被验证为有效且稳健。

来自主题: AI技术研报

8083 点击 2024-03-11 17:34

挖掘大模型固有的长文本理解能力，InfLLM在没有引入额外训练的情况下，利用一个外部记忆模块存储超长上下文信息，实现了上下文长度的扩展。

来自主题: AI技术研报

6009 点击 2024-03-11 17:31

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。

来自主题: AI资讯

6439 点击 2024-03-11 17:28

近期，来自华为诺亚方舟实验室的研究者提出了 DenseSSM，用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中，DenseSSM 保留了对最终输出至关重要的精细信息。

来自主题: AI技术研报

10287 点击 2024-03-11 17:22

微软找到了探索语言生成模型参数的新切入点！

来自主题: AI资讯

7216 点击 2024-03-10 16:28

在视频理解这一领域，尽管多模态模型在短视频分析上取得了突破性进展，展现出了较强的理解能力，但当它们面对电影级别的长视频时，却显得力不从心。因而，长视频的分析与理解，特别是对于长达数小时电影内容的理解，成为了当前的一个巨大挑战。

来自主题: AI技术研报

10784 点击 2024-03-10 16:19

众所周知，开发顶级的文生图（T2I）模型需要大量资源，因此资源有限的个人研究者基本都不可能承担得起，这也成为了 AIGC（人工智能内容生成）社区创新的一大阻碍。同时随着时间的推移，AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。

来自主题: AI技术研报

10310 点击 2024-03-10 16:10

Sanctuary AI发布了世界第一个能够以人类的速率自主完成任务的机器人，他们通过在远程控制机器人操作获取数据，在虚拟空间训练，完成了这一壮举。

来自主题: AI资讯

4782 点击 2024-03-10 16:04

一家大模型初创公司从创立到训练出大模型，要克服怎样的难题？前谷歌科学家离职后创业一年，发文自述算力是训练大模型的难点。

来自主题: AI资讯

8081 点击 2024-03-10 15:56

近期的研究表明，采用扩散模型的规划模块能够同时生成长序列的轨迹规划，这更加符合人类的决策模式。此外，扩散模型在策略表征和数据合成方面也能为现有的决策智能算法提供更优的选择。

来自主题: AI技术研报

7180 点击 2024-03-09 15:05