AI技术研报-这里有最前沿的人工智能技术解读

NeurIPS Spotlight｜从分类到生成：无训练的可控扩散生成

近年来，扩散模型（Diffusion Models）已成为生成模型领域的研究前沿，它们在图像生成、视频生成、分子设计、音频生成等众多领域展现出强大的能力。

来自主题: AI技术研报

6043 点击 2024-12-05 11:49

英伟达提出全新Star Attention，10倍加速LLM推理！登顶Hugging Face论文榜

大模型如今已具有越来越长的上下文，而与之相伴的是推理成本的上升。英伟达最新提出的Star Attention，能够在不损失精度的同时，显著减少推理计算量，从而助力边缘计算。

来自主题: AI技术研报

6629 点击 2024-12-05 11:27

1-bit大模型还能再突破！新一代BitNet架构启用4位激活值

近日，BitNet系列的原班人马推出了新一代架构：BitNet a4.8，为1 bit大模型启用了4位激活值，支持3 bit KV cache，效率再突破。

来自主题: AI技术研报

6610 点击 2024-12-05 11:12

被忽略的起点？Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

几个小时前，著名 AI 研究者、OpenAI 创始成员之一 Andrej Karpathy 发布了一篇备受关注的长推文，其中分享了注意力机制背后一些或许少有人知的故事。

来自主题: AI技术研报

7563 点击 2024-12-04 16:39

ICLR审稿集体搞抽象！评审结果写半句，还有的求ta也不审，网友：科研人自己的春晚

今天，ICLR 2025的discussion phase的ddl已经截止。回看过去14天的讨论过程，可太精彩了！

来自主题: AI技术研报

7223 点击 2024-12-04 16:29

北大字节VAR获最佳论文、厦大清华获亚军，NeurIPS 2024最佳论文出炉

刚刚，人工智能顶会 NeurIPS 公布了今年的最佳论文（包括 Best Paper 和 Best Paper Runner-up，大会注册者可以看到）。

来自主题: AI技术研报

7401 点击 2024-12-04 16:11

一次推理，实现六大3D点云分割任务！华科发布大一统算法UniSeg3D，性能新SOTA

华中科技大学研发的UniSeg3D算法，能一次性完成三维场景中的六项分割任务，提升了场景理解的全面性和效率。通过任务间的信息共享，优化了性能，为虚拟现实和机器人导航等领域带来新的解决方案。

来自主题: AI技术研报

8125 点击 2024-12-04 15:01

模型知识蒸馏新SOTA！告别传统散度蒸馏｜腾讯优图&中科大出品

用大模型“蒸馏”小模型，有新招了！

来自主题: AI技术研报

6288 点击 2024-12-04 09:34

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

想要体验文生视频的小伙伴又多了一个选择！

来自主题: AI技术研报

5154 点击 2024-12-03 20:45

扩散模型、最优传输存在什么关系？法国数学家4页论文引网友围观

扩散模型和最优传输之间到底存在怎样的联系？对很多人来说还是一个未解之谜。

来自主题: AI技术研报

7396 点击 2024-12-03 20:33

关于LLM-as-a-judge范式，终于有综述讲明白了

评估和评价长期以来一直是人工智能 (AI) 和自然语言处理 (NLP) 中的关键挑战。然而，传统方法，无论是基于匹配还是基于词嵌入，往往无法判断精妙的属性并提供令人满意的结果。

来自主题: AI技术研报

6529 点击 2024-12-03 20:21

15分钟做完一个小程序，腾讯的AI工具有点东西

我记得很久之前，我们都在讲什么低代码/无代码平台，这个概念很久了，但是，一直没有很好的落地，整体的效果也不算好。

来自主题: AI技术研报

9315 点击 2024-12-03 16:47

全自动组装家具！斯坦福发布IKEA Video Manuals数据集：首次实现「组装指令」真实场景4D对齐

斯坦福大学推出的IKEA Video Manuals数据集，通过4D对齐组装视频和说明书，为AI理解和执行复杂空间任务提供了新的挑战和研究基准，让机器人或AR眼镜指导家具组装不再是梦。

来自主题: AI技术研报

7438 点击 2024-12-03 16:37

MIT 76页深度报告：AI加速创新马太效应，科学家产出分化加剧！缺乏判断力将被淘汰

MIT的76页深度报告！AI辅助创新显著增长——这毋庸置疑。但，值得注意的是，AI加剧了不同水平科学家产出的差异，这与科学家的判断力强相关，意味着缺乏判断力的科学家在未来可能会被慢慢淘汰……

来自主题: AI技术研报

5121 点击 2024-12-03 16:25

李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖，具身智能又下一城！

如何让机器人拥有人一样的协调行动能力是具身智能不可避免的挑战，而李飞飞团队在CoRL-LEAP研讨会获得最佳论文奖的ReKep对于这一挑战交出了一张亮眼的答卷。

来自主题: AI技术研报

7060 点击 2024-12-03 15:27

讲清楚了！一文讲透扩散模型

昨天，为大家介绍了生成式对抗网络GAN，今天再来为大家介绍另一个有趣的模型：扩散模型，包括Stability AI、OpenAI、Google Brain在内的多个研究团队基于扩散模型提出了多种创新模型，如以文生图、图像生成视频生成等~

来自主题: AI技术研报

7477 点击 2024-12-03 14:53

翁荔离职OpenAI后第一个动作：万字长文探讨RLHF的漏洞，网友们抢着传看

之前领导OpenAI安全团队的北大校友翁荔（Lilian Weng），离职后第一个动作来了。当然是发～博～客。这次的博客一如既往万字干货，妥妥一篇研究综述，翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客（Reward Hacking）问题展开，即Agent利用奖励函数或环境中的漏洞来获取高奖励，而并未真正学习到预期行为。

来自主题: AI技术研报

7068 点击 2024-12-03 00:16

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科学问题正确率提高28%

最近，一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后，一个仅80亿参数的小模型，在科学问题上也能和GPT-4o一较高下！或许，单纯地卷AI计算能力并不是唯一的出路。

来自主题: AI技术研报

8288 点击 2024-12-02 15:53

让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命｜NeurIPS 2024

研究人员提出了一种方法，能够在领域数据分布持续变化的动态环境中，基于随机时刻观测的数据分布，在任意时刻生成适用的神经网络，实现前所未有的泛化能力。

来自主题: AI技术研报

7451 点击 2024-12-02 15:25

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

LLM在推理时，竟是通过一种「程序性知识」，而非照搬答案？可以认为这是一种变相的证明：LLM的确具备某种推理能力。然而存在争议的是，这项研究只能提供证据，而非证明。

来自主题: AI技术研报

8229 点击 2024-12-02 15:15

图结构转文本序列，大模型直接读懂！图推理性能大涨

大语言模型直接理解复杂图结构的新方法来了：

来自主题: AI技术研报

7319 点击 2024-12-02 14:57

微软：两个AI相互纠错，数学再涨5分

提升LLM数学能力的新方法来了——

来自主题: AI技术研报

5114 点击 2024-12-02 14:51

NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

大语言模型（LLM）在各种任务上展示了卓越的性能。然而，受到幻觉（hallucination）的影响，LLM 生成的内容有时会出现错误或与事实不符，这限制了其在实际应用中的可靠性。

来自主题: AI技术研报

8374 点击 2024-12-02 14:27

NeurIPS 2024 | 数学推理场景下，首个分布外检测研究成果来了

本文将介绍数学推理场景下的首个分布外检测研究成果。

来自主题: AI技术研报

2725 点击 2024-12-02 14:14

DeepMind用语言游戏让大模型学AlphaGo自我博弈，数据限制不存在了

自我博弈，很神奇吧？

来自主题: AI技术研报

3951 点击 2024-12-02 14:01

谷歌推出医疗AI的安卓系统-基础模型未来已来！

Google研究院健康AI团队于近日推出了全新的开源模型套件——Health AI Developer Foundations（HAI-DEF）。在本次HAI-DEF的首次发布中，Google推出了三个专注于医疗影像应用的重要模型。首先是CXR Foundation胸部X光模型，其次是Derm Foundation皮肤影像模型，第三个是Path Foundation病理学模型，它基于ViT-S架构

来自主题: AI技术研报

7128 点击 2024-12-02 10:52

假如你只有一天时间开发一个 App，前后端都要写，你能办到吗？

一天开发一个 App，听起来像是个天方夜谭吧？说实话，几年前我也觉得不可能，但在今天，借助强大的 AI 工具和合理的工作流，这事儿真的变得触手可及。当然，这并不意味着可以随便敷衍，而是需要一套高效的方法论。今天，我就来分享一下我们团队在一天内开发一个 App 的完整流程。

来自主题: AI技术研报

4010 点击 2024-12-02 09:22

微软发明全新「LLM语言」，AI智能体交互效率翻倍！

对于LLM来说，人类语言可能不是最好的交流媒介，正如《星战》中的机器人有自己的一套语言，近日，来自微软的研究人员改进了智能体间的交互方式，使模型的通信速度翻倍且不损失精度。

来自主题: AI技术研报

5298 点击 2024-12-01 15:30

ICLR 惊现[10,10,10,10]满分论文，ControlNet 作者新作，Github 5.8k 颗星

四个 10 分！罕见的一幕出现了。您正在收看的，不是中国梦之队的跳水比赛，而是 ICLR 2025 的评审现场。虽说满分论文不是前无古人，后无来者，但放在平均分才 4.76 的 ICLR，怎么不算是相当炸裂的存在呢。

来自主题: AI技术研报

6994 点击 2024-12-01 14:39

轻量化MobileMamba视觉模型来了｜浙大/腾讯优图/华中科大联合出品

浙大、腾讯优图、华中科技大学的团队，提出轻量化MobileMamba！既良好地平衡了效率与效果，推理速度远超现有基于Mamba的模型。

来自主题: AI技术研报

7290 点击 2024-12-01 14:27

AI技术研报-这里有最前沿的人工智能技术解读

NeurIPS Spotlight｜从分类到生成：无训练的可控扩散生成

英伟达提出全新Star Attention，10倍加速LLM推理！登顶Hugging Face论文榜

1-bit大模型还能再突破！新一代BitNet架构启用4位激活值

被忽略的起点？Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

ICLR审稿集体搞抽象！评审结果写半句，还有的求ta也不审，网友：科研人自己的春晚

北大字节VAR获最佳论文、厦大清华获亚军，NeurIPS 2024最佳论文出炉

一次推理，实现六大3D点云分割任务！华科发布大一统算法UniSeg3D，性能新SOTA

模型知识蒸馏新SOTA！告别传统散度蒸馏｜腾讯优图&中科大出品

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

扩散模型、最优传输存在什么关系？法国数学家4页论文引网友围观

关于LLM-as-a-judge范式，终于有综述讲明白了

15分钟做完一个小程序，腾讯的AI工具有点东西

全自动组装家具！ 斯坦福发布IKEA Video Manuals数据集：首次实现「组装指令」真实场景4D对齐

MIT 76页深度报告：AI加速创新马太效应，科学家产出分化加剧！缺乏判断力将被淘汰

李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖，具身智能又下一城！

讲清楚了！一文讲透扩散模型

翁荔离职OpenAI后第一个动作：万字长文探讨RLHF的漏洞，网友们抢着传看

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科学问题正确率提高28%

让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命｜NeurIPS 2024

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

图结构转文本序列，大模型直接读懂！图推理性能大涨

微软：两个AI相互纠错，数学再涨5分

NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

NeurIPS 2024 | 数学推理场景下，首个分布外检测研究成果来了

DeepMind用语言游戏让大模型学AlphaGo自我博弈，数据限制不存在了

谷歌推出医疗AI的安卓系统-基础模型未来已来！

假如你只有一天时间开发一个 App，前后端都要写，你能办到吗？

微软发明全新「LLM语言」，AI智能体交互效率翻倍！

ICLR 惊现[10,10,10,10]满分论文，ControlNet 作者新作，Github 5.8k 颗星

轻量化MobileMamba视觉模型来了｜浙大/腾讯优图/华中科大联合出品

全自动组装家具！斯坦福发布IKEA Video Manuals数据集：首次实现「组装指令」真实场景4D对齐