AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。

来自主题: AI技术研报
6491 点击    2025-05-23 10:18
HALO,基于MCTS的层次化动态提示框架,让Agent总能找到最优路径 | 最新

HALO,基于MCTS的层次化动态提示框架,让Agent总能找到最优路径 | 最新

HALO,基于MCTS的层次化动态提示框架,让Agent总能找到最优路径 | 最新

HALO框架通过三大创新机制重塑多Agent(MAS)协作方式:层次化推理架构克服了认知过载问题,让智能体各司其职;动态角色实例化能针对不同任务匹配专业智能体;基于MCTS的搜索引擎自动探索最优推理路径。它能将模糊的用户查询转化为专业提示,分解复杂任务并动态调整执行计划。

来自主题: AI技术研报
4945 点击    2025-05-22 09:28
华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」

华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」

华为曝光两大黑科技!打破推理延迟魔咒,大模型从此「秒回」

刚刚,昇腾两大技术创新,突破速度瓶颈重塑AI推理。FusionSpec创新的框架设计配合昇腾强大的计算能力,将投机推理框架耗时降至毫秒级,打破延迟魔咒。OptiQuant支持灵活量化,让推理性价比更高。

来自主题: AI技术研报
7015 点击    2025-05-21 14:30
策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

大语言模型(LLM)的生成范式正在从传统的「单人书写」向「分身协作」转变。传统自回归解码按顺序生成内容,而新兴的异步生成范式通过识别语义独立的内容块,实现并行生成。

来自主题: AI技术研报
6814 点击    2025-05-21 14:12
Nature子刊:人类又输给了AI,尤其是当它知道你是谁时

Nature子刊:人类又输给了AI,尤其是当它知道你是谁时

Nature子刊:人类又输给了AI,尤其是当它知道你是谁时

洛桑联邦理工学院研究团队发现,当GPT-4基于对手个性化信息调整论点时,64%的情况下说服力超过人类。实验通过900人参与辩论对比人机表现,结果显示个性化AI达成一致概率提升81.2%。研究警示LLM可能被用于传播虚假信息,建议利用AI生成反叙事内容应对威胁,但实验环境与真实场景存在差异。

来自主题: AI技术研报
6523 点击    2025-05-21 09:52
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。

来自主题: AI技术研报
8124 点击    2025-05-20 15:16