AI资讯新闻榜单内容搜索-模型训练

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推理和操作

机器人操纵的一个基本目标是使模型能够理解视觉场景并执行动作。

来自主题: AI技术研报

7413 点击 2024-06-21 13:25

从高考到奥林匹克竞技场：大模型与人类智能的终极较量

图灵奖得主Hinton在他的访谈中提及「在未来20年内，AI有50%的概率超越人类的智能水平」，并建议各大科技公司早做准备，而评定大模型（包括多模态大模型）的「智力水平」则是这一准备的必要前提。

来自主题: AI资讯

4662 点击 2024-06-21 13:15

超越CVPR 2024方法，DynRefer在区域级多模态识别任务上，多项SOTA

为了实现高精度的区域级多模态理解，本文提出了一种动态分辨率方案来模拟人类视觉认知系统。

来自主题: AI资讯

4705 点击 2024-06-21 11:55

考考大模型视频理解能力，中科院人大百川提出新基准合成框架

测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了，针对视频理解能力的那种。

来自主题: AI技术研报

10735 点击 2024-06-20 23:25

CVPR 2024 Highlight | 北航等发布「时间特征维护」：无需训练，极致压缩加速Diffusion

拯救4bit扩散模型精度，仅需时间特征维护——以超低精度量化技术重塑图像内容生成！

来自主题: AI技术研报

10790 点击 2024-06-20 11:26

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

10679 点击 2024-06-19 23:30

字节打造大模型TTS：不仅能高保真合成，而且支持调整编辑

通过高保真合成语音与真人语音无异。

来自主题: AI技术研报

10003 点击 2024-06-19 23:24

清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法

本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM。MarkLLM 提供了统⼀的⼤模型⽔印算法实现框架、直观的⽔印算法机制可视化⽅案以及系统性的评估模块，旨在⽀持研究⼈员⽅便地实验、理解和评估最新的⽔印技术进展。通过 MarkLLM，作者期望在给研究者提供便利的同时加深公众对⼤模型⽔印技术的认知，推动该领域的共识形成，进⽽促进相关研究的发展和推⼴应⽤。

来自主题: AI技术研报

9681 点击 2024-06-19 23:19

ICLR 2024 Oral | 应对随时间变化的分布偏移，西安大略大学等提出学习时序轨迹方法

在现实世界的机器学习应用中，随时间变化的分布偏移是常见的问题。这种情况被构建为时变域泛化（EDG），目标是通过学习跨领域的潜在演变模式，并利用这些模式，使模型能够在时间变化系统中对未见目标域进行良好的泛化。然而，由于 EDG 数据集中时间戳的数量有限，现有方法在捕获演变动态和避免对稀疏时间戳的过拟合方面遇到了挑战，这限制了它们对新任务的泛化和适应性。

来自主题: AI技术研报

10646 点击 2024-06-19 23:11

拯救Transformer推理能力！DeepMind新研究TransNAR：给模型嵌入「算法推理大脑」

DeepMind最近发表的一篇论文提出用混合架构的方法解决Transformer模型的推理缺陷。将Transformer的NLU技能与基于GNN的神经算法推理器（NAR）的强大算法推理能力相结合，可以实现更加泛化、稳健、准确的LLM推理。

来自主题: AI技术研报

11145 点击 2024-06-17 21:30