AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

多智能体架构Insight-V来了!突破长链视觉推理瓶颈

大语言模型(LLMs)通过更多的推理展现出了更强的能力和可靠性,从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报
6869 点击    2024-12-13 14:40
再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。

来自主题: AI技术研报
8433 点击    2024-12-13 14:32
LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

LSTM之父:我也是注意力之父!1991年就发表线性复杂度,遥遥领先Transformer 26年

Transformer模型自2017年问世以来,已成为AI领域的核心技术,尤其在自然语言处理中占据主导地位。然而,关于其核心机制“注意力”的起源,学界存在争议,一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。

来自主题: AI技术研报
7938 点击    2024-12-13 14:24
守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

守护好你的秘密!警惕前沿AI模型已具备策划能力:一项令人震惊的研究发现

最近,Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现:当前主流的前沿AI模型已经具备了基本的"策划"(Scheming)能力。

来自主题: AI技术研报
6634 点击    2024-12-13 13:42
人工评估 | 基础概念

人工评估 | 基础概念

人工评估 | 基础概念

人工评估是指让人类评价模型输出回答的好坏。本文讨论的都是后验评估,即模型已经完成训练,给定一个任务让人类进行评估。

来自主题: AI技术研报
4411 点击    2024-12-13 13:32
Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

Sora之后,苹果发布视频生成大模型STIV,87亿参数一统T2V、TI2V任务

Apple MM1Team 再发新作,这次是苹果视频生成大模型,关于模型架构、训练和数据的全面报告,87 亿参数、支持多模态条件、VBench 超 PIKA,KLING,GEN-3。

来自主题: AI技术研报
6252 点击    2024-12-12 21:57
反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

传闻反转了,Claude 3.5 Opus没有训练失败。 只是Anthropic训练好了,暗中压住不公开。 semianalysis分析师爆料,Claude 3.5超大杯被藏起来,只用于内部数据合成以及强化学习奖励建模。 Claude 3.5 Sonnet就是如此训练而来。

来自主题: AI资讯
7782 点击    2024-12-12 15:03
超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

Hyper-YOLO是一种新型目标检测方法,通过超图计算增强了特征之间的高阶关联,提升了检测性能,尤其在识别复杂场景下的中小目标时表现更出色。

来自主题: AI技术研报
8184 点击    2024-12-12 14:35
田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式

一般而言,LLM 被限制在语言空间(language space)内进行推理,并通过思维链(CoT)来表达推理过程,从而解决复杂的推理问题。

来自主题: AI技术研报
8210 点击    2024-12-12 10:19
NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

NeurIPS 2024 | LLM智能体真能模拟人类行为吗?答案有了

在这篇论文中,我们专注于人类互动中的信任行为,这种行为通过依赖他人将自身利益置于风险之中,是人类互动中最关键的行为之一,在日常沟通到社会系统中都扮演着重要角色。

来自主题: AI技术研报
8692 点击    2024-12-12 10:11