AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

AAAI 2025 | 用于韦伯区位问题的去奇异性次梯度方法

韦伯区位问题源自一个经典的运筹优化问题,它首先由著名数学家皮耶・德・费马提出,后被著名经济学家阿尔弗雷德・韦伯(著名社会学家马克斯・韦伯的弟弟)扩展,在机器学习、人工智能、金融工程及计算机视觉等众多领域均有广泛应用。

来自主题: AI技术研报
4921 点击    2024-12-30 13:45
Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

Deepmind 重磅开源:消除幻觉,让 LLMs 学会规则库和多步推理

大模型的的发布固然令人欣喜,但是各类测评也是忙坏了众多 AI 工作者。大模型推理的幻觉问题向来是 AI 测评的重灾区,诸如 9.9>9.11 的经典幻觉问题,各大厂家恨不得直接把问题用 if-else 写进来。

来自主题: AI技术研报
7106 点击    2024-12-30 10:39
机器人空间泛化也有Scaling Law!清华新国大新算法框架让机器人操作更加鲁棒

机器人空间泛化也有Scaling Law!清华新国大新算法框架让机器人操作更加鲁棒

机器人空间泛化也有Scaling Law!清华新国大新算法框架让机器人操作更加鲁棒

在机器人空间泛化领域,原来也有一套Scaling Law! 来自清华和新加坡国立大学的团队,发现了空间智能的泛化性规律。 在此基础上,他们提出了一套新颖的算法框架——ManiBox,让机器人能够在真实世界中应对多样化的物体位置和复杂的场景布置。

来自主题: AI技术研报
6315 点击    2024-12-29 17:33
向量模型的词序感知缺陷与优化策略

向量模型的词序感知缺陷与优化策略

向量模型的词序感知缺陷与优化策略

最近,LAION AI 的创始人 Christoph Schuhmann 分享了一个有趣的发现,他指出,文本向量模型似乎存在一个问题:即使句子词序被打乱,模型输出的向量与原句仍然高度相似。

来自主题: AI技术研报
7327 点击    2024-12-29 11:16
让AI理解费马大定理的证明,两个月过去了,进展如何?

让AI理解费马大定理的证明,两个月过去了,进展如何?

让AI理解费马大定理的证明,两个月过去了,进展如何?

1637 年,费马在阅读丢番图《算术》拉丁文译本时,曾在第 11 卷第 8 命题旁写道:「将一个立方数分成两个立方数之和,或一个四次幂分成两个四次幂之和,或者一般地将一个高于二次的幂分成两个同次幂之和,这是不可能的。关于此,我确信我发现一种美妙的证法,可惜这里的空白处太小,写不下。」

来自主题: AI技术研报
6486 点击    2024-12-29 11:02
可在手机终端部署,人大等提出全新人物图片保护模型RID

可在手机终端部署,人大等提出全新人物图片保护模型RID

可在手机终端部署,人大等提出全新人物图片保护模型RID

近年来许多论文研究了基于扩散模型的定制化生成,即通过给定一张或几张某个概念的图片,通过定制化学习让模型记住这个概念,并能够生成这个概念的新视角、新场景图片。

来自主题: AI技术研报
7000 点击    2024-12-28 14:04
视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

视觉语言模型易受攻击?西安交大等提出基于扩散模型的对抗样本生成新方法

对抗攻击,特别是基于迁移的有目标攻击,可以用于评估大型视觉语言模型(VLMs)的对抗鲁棒性,从而在部署前更全面地检查潜在的安全漏洞。然而,现有的基于迁移的对抗攻击由于需要大量迭代和复杂的方法结构,导致成本较高

来自主题: AI技术研报
7009 点击    2024-12-28 14:01
超越ControlNet++!腾讯优图提出动态条件选择新架构

超越ControlNet++!腾讯优图提出动态条件选择新架构

超越ControlNet++!腾讯优图提出动态条件选择新架构

超越ControlNet++,让文生图更可控的新框架来了!

来自主题: AI技术研报
6663 点击    2024-12-28 13:55
OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

OpenAI研究员首次提出「AGI时间」进化论!o1数学已达「分钟级AGI」

本月,OpenAI科学家就当前LLM的scaling方法论能否实现AGI话题展开深入辩论,认为将来AI至少与人类平分秋色;LLM scaling目前的问题可以通过后训练、强化学习、合成数据、智能体协作等方法得到解决;按现在的趋势估计,明年LLM就能赢得IMO金牌。

来自主题: AI技术研报
6569 点击    2024-12-28 13:48
Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Meta联合斯坦福发布Apollo,揭秘视频理解六大驱动力

Orr Zohar的指导老师Serena Yeung-Levy教授于2018年获得斯坦福大学博士学位,师从李飞飞和Arnold Milstein。2017年至2019年期间,Serena Yeung-Levy曾与Justin Johnson和李飞飞共同教授斯坦福大学卷积神经网络课程。

来自主题: AI技术研报
3959 点击    2024-12-28 11:54
首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR

数字生命一直是人类几十年来的追求,反映了我们对技术与人类体验交汇的深层探索。近期,复旦大学发表了一篇综述论文,首次系统梳理了角色扮演AI(Role-Playing Language Agents,RPLAs)的研究现状,现已被机器学习顶级期刊TMLR接收。

来自主题: AI技术研报
8048 点击    2024-12-28 11:43
把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。

来自主题: AI技术研报
6224 点击    2024-12-28 11:41
把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

CPU+GPU,模型KV缓存压力被缓解了。 来自CMU、华盛顿大学、Meta AI的研究人员提出MagicPIG,通过在CPU上使用LSH(局部敏感哈希)采样技术,有效克服了GPU内存容量限制的问题。

来自主题: AI技术研报
6985 点击    2024-12-28 11:38
轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

控制无人机执行敏捷、高机动性的行为是一项颇具挑战的任务。传统的控制方法,比如 PID 控制器和模型预测控制(MPC),在灵活性和效果上往往有所局限。而近年来,强化学习(RL)在机器人控制领域展现出了巨大的潜力。通过直接将观测映射为动作,强化学习能够减少对系统动力学模型的依赖。

来自主题: AI技术研报
3845 点击    2024-12-28 11:35
北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25

视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。

来自主题: AI技术研报
6273 点击    2024-12-28 11:33
国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。

来自主题: AI技术研报
6526 点击    2024-12-28 11:19
o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

o1 pro “碾压式”洞察:世界顶尖免疫学专家被机器深度分析“惊醒”

今天想跟大家聊一个科技圈和生物医学圈都值得关注的“炸裂”事件。一位顶尖的免疫学专家,Derya Unutmaz博士,刚刚分享了一段让他“震撼到情绪激动”的经历:他把自己和学生撰写的关于MAIT细胞的综述文章,交给o1-Pro进行评估,结果AI给出的评论和洞察碾压了他

来自主题: AI技术研报
6674 点击    2024-12-27 16:11
Token已死?AI认知的新范式正在崛起

Token已死?AI认知的新范式正在崛起

Token已死?AI认知的新范式正在崛起

就在OpenAI热闹的12天发布会刚刚落下帷幕,谷歌的火力全开新模型Voe2和Gemnini2吸引了全球AI开发者的眼球时,Meta作为三巨头之一则在筹划着一场静悄悄的革命。

来自主题: AI技术研报
6912 点击    2024-12-27 10:23
DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力

1822 年,电学之父法拉第在日记中写到“既然通电能够产生磁力,为什么不能用磁铁产生电流呢?我一定要反过来试试!”。于是在 1831 年,第一台发电机被发明,推动了人类进入电气化时代。

来自主题: AI技术研报
6623 点击    2024-12-27 10:16
引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考(long thought)的帮助下,LLM 倾向于探索、反思和自我改进推理过程,以获得更准确的答案。

来自主题: AI技术研报
7113 点击    2024-12-27 10:03
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

大模型中,线性层的低比特量化已经逐步落地。然而,对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。并且,随着大型模型需要处理的序列长度不断增加,Attention(注意力运算)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
6527 点击    2024-12-27 09:44
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora

Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。

来自主题: AI技术研报
6585 点击    2024-12-26 15:43
2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2025 AI Agent剑指何方?两份前沿报告描绘全景地图

2024年,AI Agent称得上最火热的概念。一方面,大模型赛道降温,并呈现出赢家通吃的局面;另一方面,AI Agent则是大模型应用落地的最佳形式,其能够解决LLMs在具体应用场景中的局限性。

来自主题: AI技术研报
7353 点击    2024-12-26 09:15
MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

MIT、OpenAI等震撼力作:AI首次自主发现人工生命!人类窥见上帝造物

Sakana AI联合MIT、OpenAI等机构提出了全新算法,自动搜索人工生命再达新的里程碑!不需要繁琐手工设计,只通过描述,AI就能发现全新的人造生命体了。

来自主题: AI技术研报
8299 点击    2024-12-25 21:05