AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
天工所打造!国内首个生物制造大语言模型,网页版已上线!

天工所打造!国内首个生物制造大语言模型,网页版已上线!

天工所打造!国内首个生物制造大语言模型,网页版已上线!

当前,传统生物制造方法在知识整合、数据处理和实验设计方面面临诸多挑战,限制了其在工业化应用中的效率和可扩展性。

来自主题: AI技术研报
8353 点击    2025-03-24 10:41
硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限

硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限

硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限

硅谷投资人Tom Davidson的硬核长文预测,给出了惊人结论:全栈的AI大爆炸,或将率先发生在中国!而当芯片规模扩大1万倍时,AI将逼近物理极限。

来自主题: AI技术研报
6930 点击    2025-03-24 10:31
ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen

ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen

ICLR 2025 Spotlight|让机器人实现「自主进化」,蚂蚁数科、清华提出具身协同框架 BodyGen

最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由蚂蚁数科与清华大学联合团队提出的全新具身协同框架 BodyGen 成功入选 Spotlight(聚光灯/特别关注)论文。

来自主题: AI技术研报
6940 点击    2025-03-24 10:03
CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。

来自主题: AI技术研报
5513 点击    2025-03-24 09:59
用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?

来自主题: AI技术研报
6904 点击    2025-03-24 09:20
华人科学家登上Nature:几行代码,优化复合AI系统

华人科学家登上Nature:几行代码,优化复合AI系统

华人科学家登上Nature:几行代码,优化复合AI系统

华人学者、斯坦福大学副教授 James Zou 领导的团队提出了 TextGrad ,通过文本自动化“微分”反向传播大语言模型(LLM)文本反馈来优化 AI 系统。只需几行代码,你就可以自动将用于分类数据的“逐步推理”提示转换为一个更复杂的、针对特定应用的提示。

来自主题: AI技术研报
5597 点击    2025-03-24 09:00
2030年,AGI概率至少10%!AI范式转变快,谁能预测GenAI下一代?

2030年,AGI概率至少10%!AI范式转变快,谁能预测GenAI下一代?

2030年,AGI概率至少10%!AI范式转变快,谁能预测GenAI下一代?

Epoch AI高级研究员预测:2030年实现人类水平的AI的可能性至少10%。他认为AI从监督学习到GenAI,模型范式转变迅捷,预测AI只能从第一性原理出发。参考人类大脑,他估算了发现人类水平的AI需要的算力,得到相关结论。

来自主题: AI技术研报
5313 点击    2025-03-23 14:38
喝点VC | 顶级风投Lightspeed发布生成式游戏报告:世界模型将是AI的下一个主要形式

喝点VC | 顶级风投Lightspeed发布生成式游戏报告:世界模型将是AI的下一个主要形式

喝点VC | 顶级风投Lightspeed发布生成式游戏报告:世界模型将是AI的下一个主要形式

人工智能正在重塑游戏和互动媒体行业,人工智能是前所未有的价值创造源泉,它重塑行业的速度甚至比我们在互联网、移动电话和云计算兴起时所观察到的平台和架构变革还要快。

来自主题: AI技术研报
7948 点击    2025-03-22 17:13
a16z详解MCP,以及AI工具的未来

a16z详解MCP,以及AI工具的未来

a16z详解MCP,以及AI工具的未来

自 2023年OpenAI发布函数调用功能以来,我一直在思考如何开启智能体和工具使用的生态系统。随着基础模型变得越来越智能,智能体与外部工具、数据和API交互的能力却日益碎片化:开发人员需要为智能体运行和集成的每个系统都实现具有特殊业务逻辑的智能体。

来自主题: AI技术研报
4789 点击    2025-03-22 16:52
万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

万字探讨Agent发展真方向:模型即产品,Agent的未来要靠模型而不是Workflow

知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。

来自主题: AI技术研报
6405 点击    2025-03-22 16:38
CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代

CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代

CVPR 2025 高分论文 | 单图秒变3D真人!IDOL技术开启数字分身新时代

在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。

来自主题: AI技术研报
7264 点击    2025-03-22 16:08
强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任务中,性能可以提高最多 50 倍。

来自主题: AI技术研报
6749 点击    2025-03-22 15:55
13年后,AlexNet源代码终于公开:带注释的原版

13年后,AlexNet源代码终于公开:带注释的原版

13年后,AlexNet源代码终于公开:带注释的原版

从一行行代码、注释中感受 AlexNet 的诞生,或许老代码中还藏着启发未来的「新」知识。

来自主题: AI技术研报
7292 点击    2025-03-22 14:53
对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025

对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025

对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025

自动驾驶实现垂直领域的AGI,有了新路径。不是Robotaxi,而是RoadAGI。在英伟达GTC 2025上,元戎启行CEO周光受邀分享,提出用RoadAGI,能更快大规模商用自动驾驶,实现垂直道路场景下的AGI,RoadAGI的实施平台,是元戎最新分享的AI Spark:

来自主题: AI技术研报
5884 点击    2025-03-22 14:32
宇宙也有智能?智能体不但是AI领域核心,更可能引发科学范式重大变革!

宇宙也有智能?智能体不但是AI领域核心,更可能引发科学范式重大变革!

宇宙也有智能?智能体不但是AI领域核心,更可能引发科学范式重大变革!

中国科学院大学团队在这篇论文中,提出了一个崭新观点:智能体不但是AI领域的核心,更可能是构成宇宙的基本单元,或许还将引发21世纪科学范式的重大变革!

来自主题: AI技术研报
4639 点击    2025-03-22 11:17
树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架

树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架

树搜索也存在「过思考」与「欠思考」?腾讯AI Lab与厦大联合提出高效树搜索框架

本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题,并提出高效树搜索框架——Fetch。本研究由腾讯 AI Lab 与厦门大学、苏州大学研究团队合作完成。

来自主题: AI技术研报
4503 点击    2025-03-22 11:06
清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025

清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025

清华&哈佛4D语言场建模新方法,动态场景精准识别|CVPR2025

来自清华大学、哈佛大学等机构的研究团队提出了一种创新方法——4D LangSplat。该方法基于动态三维高斯泼溅技术,成功重建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。这一突破为相关领域的研究与应用提供了新的可能性, 该工作目前已经被CVPR2025接收。

来自主题: AI技术研报
6658 点击    2025-03-22 11:01
英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

英伟达开源自适应多模态「世界生成」模型!开启机器人、自动驾驶训练革命

Nvidia刚刚发布了「世界生成」模型Cosmos-Transfer1,可以根据多种模态的空间控制输入(如分割、深度和边缘)生成世界模拟,使得世界生成具有高度可控性。开发者使用模型能够创建高度逼真的模拟环境,用于训练机器人和自动驾驶车辆。

来自主题: AI技术研报
7625 点击    2025-03-22 10:56
Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学团队提出了ARINAR模型,与何凯明团队此前提出的分形生成模型类似,采用双层自回归结构逐特征生成图像,显著提升了生成质量和速度,性能超越了FractalMAR模型,论文和代码已公开。

来自主题: AI技术研报
6724 点击    2025-03-22 10:50
Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

Nature发文「智能体摩尔定律」,Agent能力每7个月翻倍,5年后能顶人类苦干一个月的工作

AI Agents(智能体)也有自己的“摩尔定律”了?!就在最近,Nature报道了一项来自非营利研究机构METR的最新发现:AI在完成长期任务方面的进步速度惊人,其时间跨度大约每七个月翻一番。

来自主题: AI技术研报
8022 点击    2025-03-21 14:57
用两个LLM执行PLAN-AND-ACT,让Agent在长任务中提高规划能力54% | UC伯克利最新

用两个LLM执行PLAN-AND-ACT,让Agent在长任务中提高规划能力54% | UC伯克利最新

用两个LLM执行PLAN-AND-ACT,让Agent在长任务中提高规划能力54% | UC伯克利最新

当你要求AI"帮我订一张去纽约的机票"时,它需要理解目标、分解步骤、适应变化,这个过程远比看起来复杂。UC伯克利的研究者们带来了振奋人心的新发现:通过将任务规划和执行分离的PLAN-AND-ACT框架,他们成功将智能体在长期任务中的规划能力提升了54%,创造了新的技术突破。

来自主题: AI技术研报
4899 点击    2025-03-21 14:37
RAG发展图谱:从基础检索到记忆增强,再到自适应RAG的五大范式 | RAG最新综述

RAG发展图谱:从基础检索到记忆增强,再到自适应RAG的五大范式 | RAG最新综述

RAG发展图谱:从基础检索到记忆增强,再到自适应RAG的五大范式 | RAG最新综述

RAG工作发展时间线(2020年至今)。展示了RAG相关研究的三个主要领域:基础(包括RAG学习和RAG框架)、进阶和评估。关键的语言模型(GPT-3、GPT-4等)发展节点标注在时间线上。

来自主题: AI技术研报
7486 点击    2025-03-21 12:18
黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

在GTC2025大会上,NVIDIA依旧延续着“算力的故事”。如果AI的发展依旧遵循着scaling law(规模定律),那么这个故事还能继续讲下去。

来自主题: AI技术研报
2525 点击    2025-03-21 11:57
硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区

硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区

硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区

随着硅基流动的 SiliconCloud 等平台上线 DeepSeek-R1,市面上出现了不少测试各大厂商 API 服务的评测文章及反馈,不过,从我们收到的不少内容及反馈来看,其中的对比测试方式多有漏洞,内容质量参差不齐。

来自主题: AI技术研报
9196 点击    2025-03-21 11:48
单张照片实现三维重建,单视角室外复杂场景首次攻克| 西湖大学&港科大&Everlyn AI

单张照片实现三维重建,单视角室外复杂场景首次攻克| 西湖大学&港科大&Everlyn AI

单张照片实现三维重建,单视角室外复杂场景首次攻克| 西湖大学&港科大&Everlyn AI

单视角三维场景重建一直是计算机视觉领域中的核心挑战之一,尤其在捕捉高保真室外场景细节时,如何确保结构一致性和几何精度显得尤为困难。

来自主题: AI技术研报
7953 点击    2025-03-21 10:40