AI资讯新闻榜单内容搜索-训练

超图计算+目标检测，性能新SOTA！清华发布Hyper-YOLO：用超图捕捉高阶视觉关联

Hyper-YOLO是一种新型目标检测方法，通过超图计算增强了特征之间的高阶关联，提升了检测性能，尤其在识别复杂场景下的中小目标时表现更出色。

来自主题: AI技术研报

8187 点击 2024-12-12 14:35

一般而言，LLM 被限制在语言空间（language space）内进行推理，并通过思维链（CoT）来表达推理过程，从而解决复杂的推理问题。

来自主题: AI技术研报

8212 点击 2024-12-12 10:19

在这篇论文中，我们专注于人类互动中的信任行为，这种行为通过依赖他人将自身利益置于风险之中，是人类互动中最关键的行为之一，在日常沟通到社会系统中都扮演着重要角色。

来自主题: AI技术研报

8696 点击 2024-12-12 10:11

目前大语言模型（Large Language Models, LLMs）的推理能力备受关注。从思维链（Chain of Thought，CoT）技术提出，到以 o1 为代表的长思考模型发布，大模型正在展现出接近人类甚至领域专家的水平，其中数学推理是一个典型任务。

来自主题: AI技术研报

8779 点击 2024-12-12 10:06

近日，IBM宣布了一项重大的光学技术突破，该技术可以以光速训练AI模型，同时节省大量能源。

来自主题: AI资讯

8232 点击 2024-12-11 14:55

引用超85000次的经典论文GAN获NeurIPS2024时间检验奖后，它的起源和背后故事也被抛了出来。要从Yoshua Bengio实验室的一次头脑风暴说起。

来自主题: AI资讯

8317 点击 2024-12-11 14:24

Allen Institute for AI（AI2）发布了Tülu 3系列模型，一套开源的最先进的语言模型，性能与GPT-4o-mini等闭源模型相媲美。Tülu 3包括数据、代码、训练配方和评估框架，旨在推动开源模型后训练技术的发展。

来自主题: AI技术研报

8713 点击 2024-12-10 16:23

支持大模型一路狂飙的 Scaling Law 到头了？近期，AI 圈针对 Scaling Law 是否到头产生了分歧。一派观点认为 Scaling Law 已经「撞墙」了，另一派观点（如 OpenAI CEO Sam Altman）仍然坚定 Scaling Law 的潜力尚未穷尽。

来自主题: AI技术研报

8076 点击 2024-12-09 14:59

为了构建鲁棒的 3D 机器人操纵大模型，Lift3D 系统性地增强 2D 大规模预训练模型的隐式和显式 3D 机器人表示，并对点云数据直接编码进行 3D 模仿学习。Lift3D 在多个仿真环境和真实场景中实现了 SOTA 的操纵效果，并验证了该方法的泛化性和可扩展性。

来自主题: AI技术研报

8232 点击 2024-12-09 14:55

北京交通大学研究团队悄默声推出了一版o1，而且所有源代码、精选数据集以及衍生模型都开源！

来自主题: AI技术研报

9752 点击 2024-12-09 14:52