AI资讯新闻榜单内容搜索-训练

深度 | 9款GPU横评，哪些适合大模型训练，哪些适合推理任务？

在 AI 领域，有两大场景对 GPU 的需求最大，一个是模型训练，另一个是 AI 推理任务。

来自主题: AI资讯

11619 点击 2024-09-24 12:32

GPT-4o 读万卷书，「o1」行万里路。

来自主题: AI资讯

7146 点击 2024-09-24 09:49

近日，上海人工智能实验室推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍，书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视频生成大模型。

来自主题: AI资讯

5559 点击 2024-09-23 15:30

LLaMA-Omni能够接收语音指令，同步生成文本和语音响应，响应延迟低至 226ms，低于 GPT-4o 的平均音频响应延迟 320ms。

来自主题: AI资讯

4217 点击 2024-09-23 15:25

虽然 RLHF 的初衷是用来控制人工智能（AI），但实际上它可能会帮助 AI 欺骗人类。

来自主题: AI资讯

5830 点击 2024-09-23 15:17

DeepMind最近的研究提出了一种新框架AligNet，通过模拟人类判断来训练教师模型，并将类人结构迁移到预训练的视觉基础模型中，从而提高模型在多种任务上的表现，增强了模型的泛化性和鲁棒性，为实现更类人的人工智能系统铺平了道路。

来自主题: AI技术研报

11282 点击 2024-09-22 15:00

视觉 / 激光雷达里程计是计算机视觉和机器人学领域中的一项基本任务，用于估计两幅连续图像或点云之间的相对位姿变换。它被广泛应用于自动驾驶、SLAM、控制导航等领域。最近，多模态里程计越来越受到关注，因为它可以利用不同模态的互补信息，并对非对称传感器退化具有很强的鲁棒性。

来自主题: AI技术研报

11039 点击 2024-09-22 14:00

自从 OpenAI 的 o1 问世以来，它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练，它就能直接拿下数学奥赛金牌，甚至可以在博士级别的科学问答环节上超越人类专家。

来自主题: AI资讯

8816 点击 2024-09-22 13:46

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

9361 点击 2024-09-21 18:19

CoT只对数学、符号推理才起作用，其他的任务几乎没什么卵用！这是来自UT-Austin、霍普金斯、普林斯顿三大机构研究人员联手，分析了100+篇论文14类任务得出的结论。看来，CoT并非是所有大模型标配。

来自主题: AI资讯

10061 点击 2024-09-21 17:02