AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!

来自主题: AI技术研报
9050 点击    2025-02-25 14:59
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%

近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。

来自主题: AI技术研报
8010 点击    2025-02-25 14:48
LLM自学成才变身「预言家」!预测未来能力大幅提升

LLM自学成才变身「预言家」!预测未来能力大幅提升

LLM自学成才变身「预言家」!预测未来能力大幅提升

还在惊叹预言家的神奇?如今LLM也掌握了预测未来的「超能力」!研究人员通过自我博弈和直接偏好优化,让LLM摆脱人工数据依赖,大幅提升预测能力。

来自主题: AI技术研报
6945 点击    2025-02-25 14:32
DeepSeek一体机,政企AI的“蒸汽革命”

DeepSeek一体机,政企AI的“蒸汽革命”

DeepSeek一体机,政企AI的“蒸汽革命”

DeepSeek,就是AI一体机的“瓦特时刻”

来自主题: AI技术研报
7714 点击    2025-02-25 14:01
一文详解:DeepSeek 第二天开源的 DeepEP

一文详解:DeepSeek 第二天开源的 DeepEP

一文详解:DeepSeek 第二天开源的 DeepEP

DeepSeek 本周正在连续 5 天发布开源项目,今天是第 2 天,带来了专为混合专家模型(MoE)和专家并行(EP)打造的高效通信库 — DeepEP。就在半小时前,官方对此进行了发布,以下是由赛博禅心带来的详解。

来自主题: AI技术研报
7376 点击    2025-02-25 11:18
万字打造RAG应用必知:BM25算法实战解析,让你不落人后

万字打造RAG应用必知:BM25算法实战解析,让你不落人后

万字打造RAG应用必知:BM25算法实战解析,让你不落人后

文章主要是实现了中英文版本的BM25算法(主要就是分词部分有区别),算法可能也有缺陷,恳请看见的大佬指点指点,虽然也有比我实现的要更优秀的第三方库,比如bm25s

来自主题: AI技术研报
9086 点击    2025-02-25 09:53
Ai陪伴调研整理(20250221)

Ai陪伴调研整理(20250221)

Ai陪伴调研整理(20250221)

其实,这个话题我也不好意思开口,去年7月的时候我就关注过这个 AI情趣娃娃;在具身智能发展成熟时,表情陪伴人形机器人有望成为主流产品形态。表情陪伴人形机器人属情绪陪伴机器人高端领域,指的是硅胶皮肤覆盖,根据仿生学原理模仿人的外观设计、能够与人类进行自然交互的人形机器人。

来自主题: AI技术研报
10263 点击    2025-02-25 09:49
南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手

南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手

南大钱超团队攻克百亿晶体管难题,斩获EDA顶会2025最佳论文!AI学院本硕博生联手

南大AI学院钱超教授团队,荣获EDA顶会2025最佳论文奖!其中,论文一作、四作、五作都是南大人工智能学院的本硕博生。芯片设计领域的传统难题——如何为多达百亿量级晶体管设计最优布局,从此有了一种巧妙的全新方法。

来自主题: AI技术研报
9292 点击    2025-02-24 16:59
不用GAN不用扩散,无需训练解锁AI生图新境界!判别模型成神秘第三极

不用GAN不用扩散,无需训练解锁AI生图新境界!判别模型成神秘第三极

不用GAN不用扩散,无需训练解锁AI生图新境界!判别模型成神秘第三极

你能想象判别模型也能成为强大的图像合成高手吗?「直接上升合成」(DAS)做到了!它突破传统认知,借助多分辨率优化等创新技术,在图像生成的多个关键任务中表现出色。

来自主题: AI技术研报
4792 点击    2025-02-24 16:37
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。

来自主题: AI技术研报
7693 点击    2025-02-24 14:40
开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器

开源赛道太挤了!月之暗面开源新版Muon优化器

省一半算力跑出2倍效果,月之暗面开源优化器Muon,同预算下全面领先。

来自主题: AI技术研报
6530 点击    2025-02-24 13:56
扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体

最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。然而,尽管扩散模型在图像生成任务中表现优异,但在图像目标移除任务中仍然面临诸多挑战。现有方法在移除前景目标后,可能会留下残影或伪影,难以实现与背景的自然融合。

来自主题: AI技术研报
6746 点击    2025-02-24 13:20
Multi-Agent辩论树ToD:让AI具备批判性思维,用R1推理,解决复杂认知任务

Multi-Agent辩论树ToD:让AI具备批判性思维,用R1推理,解决复杂认知任务

Multi-Agent辩论树ToD:让AI具备批判性思维,用R1推理,解决复杂认知任务

随着AI工具越来越普及,类似Deep Researh这样的工具越来越好用,科学研究成果呈现爆炸式增长。以arXiv为例,仅2024年10月就收到超过24,000篇论文提交。

来自主题: AI技术研报
7628 点击    2025-02-24 10:09
ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法

ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法

ICLR 2025|南洋理工大学AvatarGO,探索4D人与物体交互生成新方法

近年来,随着扩散模型和 Transformer 技术的快速发展,4D 人体 - 物体交互(HOI)的生成与驱动效果取得了显著进展。然而,当前主流方法仍依赖 SMPL [1] 这一人体先验模型来生成动作。

来自主题: AI技术研报
8143 点击    2025-02-23 16:39
Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

Bengio参与,扩散模型+蒙特卡洛树搜索实现System 2规划

把扩散模型的生成能力与 MCTS 的自适应搜索能力相结合,会是什么结果?

来自主题: AI技术研报
7099 点击    2025-02-23 16:16
月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

2 月 18 日,月之暗面发布了一篇关于稀疏注意力框架 MoBA 的论文。MoBA 框架借鉴了 Mixture of Experts(MoE)的理念,提升了处理长文本的效率,它的上下文长度可扩展至 10M。并且,MoBA 支持在全注意力和稀疏注意力之间无缝切换,使得与现有的预训练模型兼容性大幅提升。

来自主题: AI技术研报
7116 点击    2025-02-23 11:38
斯坦福最新AI Agent序列化证伪假设检验自动化框架,向卡尔·波普尔致敬

斯坦福最新AI Agent序列化证伪假设检验自动化框架,向卡尔·波普尔致敬

斯坦福最新AI Agent序列化证伪假设检验自动化框架,向卡尔·波普尔致敬

在人工智能高速发展的今天,我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设,它们看似合理,却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。

来自主题: AI技术研报
8322 点击    2025-02-23 11:13
3元+2小时,普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

3元+2小时,普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

3元+2小时,普通人也能训练自己的AI大模型!GitHub爆火8.9k星项目,技术圈炸了!

GitHub上一个开源项目彻底打破门槛:只需3块钱、2小时,普通人也能从零训练自己的语言模型!项目“MiniMind”上线即爆火,狂揽8.9k星标,技术圈直呼:“这才是AI民主化的未来!”

来自主题: AI技术研报
9011 点击    2025-02-23 10:30
1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了,就是没有开源训练代码和数据。现在,开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报
7727 点击    2025-02-22 21:30
DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?

来自主题: AI技术研报
7843 点击    2025-02-22 21:27