AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步

知识蒸馏通过训练一个紧凑的学生模型来模仿教师模型的 Logits 或 Feature Map,提高学生模型的准确性。迁移学习则通常通过预训练和微调,将预训练阶段在大规模数据集上学到的知识通过骨干网络共享应用于下游任务。

来自主题: AI技术研报
3498 点击    2025-01-28 11:57
CityDreamer4D: 下一个世界模型,何必是视频生成模型?

CityDreamer4D: 下一个世界模型,何必是视频生成模型?

CityDreamer4D: 下一个世界模型,何必是视频生成模型?

在过去的两年里,城市场景生成技术迎来了飞速发展,一个全新的概念 ——世界模型(World Model)也随之崛起。当前的世界模型大多依赖 Video Diffusion Models(视频扩散模型)强大的生成能力,在城市场景合成方面取得了令人瞩目的突破。然而,这些方法始终面临一个关键挑战:如何在视频生成过程中保持多视角一致性?

来自主题: AI技术研报
4963 点击    2025-01-28 11:53
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理

2028年,预计高质量数据将要耗尽,数据Scaling走向尽头。2025年,测试时计算将开始成为主导AI通向通用人工智能(AGI)的新一代Scaling Law。近日,CMU机器学习系博客发表新的技术文章,从元强化学习(meta RL)角度,详细解释了如何优化LLM测试时计算。

来自主题: AI技术研报
5607 点击    2025-01-27 14:03
人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

AI模型可能并没有想象中强大。在最新的AI基准测试「人类最后一次考试」中,所有顶尖LLM通过率不超过10%,而且模型都表现得过度自信。

来自主题: AI技术研报
5622 点击    2025-01-27 13:36
六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

研究人员首次探讨了大型语言模型(LLMs)在问题生成任务中的表现,与人类生成的问题进行了多维度对比,结果发现LLMs倾向于生成需要较长描述性答案的问题,且在问题生成中对上下文的关注更均衡。

来自主题: AI技术研报
6844 点击    2025-01-27 13:26
顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务

顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务

顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务

智能体究竟能否应对现实世界的复杂性?The Agent Company近日提出了一项评估基准,让多个智能体尝试自主运营一个软件公司。结果表明,即使是当前最先进的智能体,也无法自主完成大多数任务。

来自主题: AI技术研报
5049 点击    2025-01-26 17:43
贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行

论文一作刘少腾,Adobe Research实习生,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是多模态大模型和生成模型,包含图像视频的生成、理解与编辑。作者Tianyu Wang、Soo Ye Kim等均为Adobe Research Scientist。

来自主题: AI技术研报
4498 点击    2025-01-26 11:39
阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节

阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节

阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节

本周,在阿里云通义千问 Qwen 团队提交的一篇论文中,研究人员发现了目前最热门的 MoE(混合专家模型)训练中存在的一个普遍关键问题,并提出一种全新的方法——通过轻量的通信将局部均衡放松为全局均衡,使得 MoE 模型的性能和专家特异性都得到了显著的提升。

来自主题: AI技术研报
2810 点击    2025-01-26 11:12
向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling

向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling

向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling

视觉版o1的初步探索,阶跃星辰&北航团队推出“慢感知”。研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。

来自主题: AI技术研报
4574 点击    2025-01-26 00:18
浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界

浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界

浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界

随着大模型(LLMs)的发展,AI 写作取得了较大进展。然而,现有的方法大多依赖检索知识增强生成(RAG)和角色扮演等技术,其在信息的深度挖掘方面仍存在不足,较难突破已有知识边界,导致生成的内容缺乏深度和原创性。

来自主题: AI技术研报
6859 点击    2025-01-25 23:50
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。

来自主题: AI技术研报
5764 点击    2025-01-25 09:38
2025智能体元年!斯坦福科学家8000字讲清所有要点

2025智能体元年!斯坦福科学家8000字讲清所有要点

2025智能体元年!斯坦福科学家8000字讲清所有要点

AI智能体正悄然成为我们工作和生活中的得力助手。从自动化任务到复杂规划,它们不仅能帮我们做市场调研、准备面试,还能完成复杂的决策任务。

来自主题: AI技术研报
8212 点击    2025-01-24 15:21
推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

推理模型规划任务成功率从5%到95%,DeepMind遗传算法新研究火了

瞄准推理时扩展(Inference-time scaling),DeepMind新的进化搜索策略火了! 所提出的“Mind Evolution”(思维进化),能够优化大语言模型(LLMs)在规划和推理中的响应。

来自主题: AI技术研报
8511 点击    2025-01-24 15:05
会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相

会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相

会用ChatGPT≠工程师,谷歌资深员工发文,揭秘AI编程不为人知的真相

苏格拉底曾提到的门诺悖论(Meno's paradox)认为,人只能学会自己已经知道的事情;而关于AI辅助编程,谷歌资深工程师最近的一篇博客告诉我们,类似的知识悖论同样存在。

来自主题: AI技术研报
6679 点击    2025-01-24 14:54
用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐

用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐

用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐

OpenAI 在 “双十二” 发布会的最后一天公开了 o 系列背后的对齐方法 - deliberative alignment,展示了通过系统 2 的慢思考能力提升模型安全性的可行性。

来自主题: AI技术研报
6926 点击    2025-01-24 14:45
高效Attention引擎是怎样炼成的?陈天奇团队FlashInfer打响新年第一枪!

高效Attention引擎是怎样炼成的?陈天奇团队FlashInfer打响新年第一枪!

高效Attention引擎是怎样炼成的?陈天奇团队FlashInfer打响新年第一枪!

新年第一天,陈天奇团队的FlashInfer论文出炉!块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。

来自主题: AI技术研报
6333 点击    2025-01-24 13:58
不断用AI自己生成的内容去喂它,你猜怎么着?

不断用AI自己生成的内容去喂它,你猜怎么着?

不断用AI自己生成的内容去喂它,你猜怎么着?

ChatGPT等聊天机器人背后的算法能从各种各样的网络文本中抓取万亿字节的素材,文本来源可以是网络文章,也可以是社媒平台的帖子,还可以是视频里的字幕或评论。

来自主题: AI技术研报
3797 点击    2025-01-24 13:13
DeepSeek新模型大揭秘,为何它能震动全球AI圈

DeepSeek新模型大揭秘,为何它能震动全球AI圈

DeepSeek新模型大揭秘,为何它能震动全球AI圈

时隔不到一个月,DeepSeek又一次震动全球AI圈。去年 12 月,DeepSeek推出的DeepSeek-V3在全球AI领域掀起了巨大的波澜,它以极低的训练成本,实现了与GPT-4o和Claude Sonnet 3.5等顶尖模型相媲美的性能,震惊了业界。

来自主题: AI技术研报
5479 点击    2025-01-24 13:05
UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

UC伯克利等提出具身智能「动作Tokenizer」,效率飙升5倍!

研究者提出了FAST,一种高效的动作Tokenizer。通过结合离散余弦变换(DCT)和字节对编码(BPE),FAST显著缩短了训练时间,并且能高效地学习和执行复杂任务,标志着机器人自回归Transformer训练的一个重要突破。

来自主题: AI技术研报
7089 点击    2025-01-23 13:19
化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

化解机器人的「幻觉」:北大发布OmniManip,VLM结合双闭环系统,3D理解能力大幅提升

近年来视觉语⾔基础模型(Vision Language Models, VLMs)在多模态理解和⾼层次常识推理上⼤放异彩,如何将其应⽤于机器⼈以实现通⽤操作是具身智能领域的⼀个核⼼问题。这⼀⽬标的实现受两⼤关键挑战制约:

来自主题: AI技术研报
7126 点击    2025-01-23 13:09
可灵视频生成可控性为什么这么好?快手又公开了四篇研究

可灵视频生成可控性为什么这么好?快手又公开了四篇研究

可灵视频生成可控性为什么这么好?快手又公开了四篇研究

可灵,视频生成领域的佼佼者,近来动作不断。继发布可灵 1.6 后,又公开了多项研究揭示视频生成的洞察与前沿探索 ——《快手可灵凭什么频繁刷屏?揭秘背后三项重要研究》。

来自主题: AI技术研报
7299 点击    2025-01-23 11:32
选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化

选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化

选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化

今天是个好日子,DeepSeek 与 Kimi 都更新了最新版的推理模型,吸引了广泛关注。与此同时,谷歌 DeepMind、加州大学圣地亚哥分校、阿尔伯塔大学的一篇新的研究论文也吸引了不少眼球,并直接冲上了 Hugging Face 每日论文榜第一(1 月 20 日)。

来自主题: AI技术研报
6067 点击    2025-01-23 10:58
6天连发6模型,阶跃稳稳蝉联多模态卷王

6天连发6模型,阶跃稳稳蝉联多模态卷王

6天连发6模型,阶跃稳稳蝉联多模态卷王

我勒个老天奶,大模型六小强之一的阶跃星辰,给大家拜早年的方式可真不一样——

来自主题: AI技术研报
3803 点击    2025-01-23 10:50
智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉

智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉

智元机器人北大实习生推出OmniManip,引入自我校正机制,缓解大模型幻觉

2024年,智元机器人与北大成立联合实验室,8月发布“远征”与“灵犀”两大系列共五款商用人形机器人新品,10月旗下灵犀X1人形机器人官宣开源,12月宣布正式开启通用机器人量产,不断拓展应用场景。

来自主题: AI技术研报
5822 点击    2025-01-22 18:34
登Nature子刊,北大团队用AI预测新冠/艾滋病/流感病毒进化方向,精度提升67%

登Nature子刊,北大团队用AI预测新冠/艾滋病/流感病毒进化方向,精度提升67%

登Nature子刊,北大团队用AI预测新冠/艾滋病/流感病毒进化方向,精度提升67%

北京大学信息工程学院田永鸿教授、陈杰副教授,联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等,提出了一种进化驱动的病毒变异驱动力预测框架 E2VD,可以对新冠病毒、流感病毒、寨卡病毒、艾滋病病毒进行预测。

来自主题: AI技术研报
5864 点击    2025-01-22 18:18
人大清华提出自主搜索版「Search-o1」!解决知识困境,大幅提升推理模型可靠性

人大清华提出自主搜索版「Search-o1」!解决知识困境,大幅提升推理模型可靠性

人大清华提出自主搜索版「Search-o1」!解决知识困境,大幅提升推理模型可靠性

人大清华团队提出Search-o1框架,大幅提升推理模型可靠性。尤其是「文档内推理」模块有效融合了知识学习与推理过程,在「搜索+学习」范式基础上,使得模型的推理表现与可靠性都更上一层楼。

来自主题: AI技术研报
6051 点击    2025-01-22 10:28