老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!
7370点击    2026-05-01 11:08

就在今天,这条消息全网刷屏了。


英伟达用AI设计GPU,原本需要8名资深工程师10个月才能完成的任务,一夜就完成了!


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


在刚刚过去的英伟达GTC大会上,首席科学家Bill Dally与谷歌首席科学家Jeff Dean的一场巅峰对话,揭露了令人震惊的这个事实。


现在,这个Youtube演讲已经有上万人观看,受到网友们的盛赞。


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


在半导体行业的历史长河中,摩尔定律曾是不可逾越的真理,但随着物理极限的逼近,研发一款旗舰GPU的复杂程度已呈指数级增长。


但现在,英伟达的AI造芯神技,几乎让人类工程师彻底退居二线了?


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


从「80个人月」到「一块GPU的一夜」


在传统芯片设计流程中,标准单元库(Standard Cell Library)的迁移是一项极度枯燥且耗时的重体力活。


每当台积电或三星推出新的半导体工艺(如从5nm跨越到3nm),英伟达必须将其包含约2500至3000个单元的基础库重新适配新工艺。


Bill Dally透露,过去这项任务需要一个由8名资深工程师组成的团队,连续奋斗10个月才能完成,总计耗费80个人月的人力成本。


但在AI介入后,这一切被彻底颠覆了!


现在,英伟达开发了一款基于强化学习的工具——NB-Cell。只需将需求输入系统,一块GPU在一夜之间即可完成全部迁移工作


在这个过程中,NB-Cell通过不断的试错和自我优化,在极短时间内探索数以亿计的设计排列组合。


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


令人震惊的是,AI生成的单元在尺寸(Area)、功耗(Power)和延迟(Delay)等核心指标上,不仅达到了人类水平,甚至在某些案例中优于人类的手工设计。


这种「隔夜交付」的能力,意味着英伟达可以比竞争对手更早地跑通新工艺,从而在硬件竞赛中始终保持身位领先。


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


AI在芯片设计中的具体应用层次


逻辑重塑:Prefix RL与「非人类直觉」的布局


如果说NB-Cell解决的是重复性劳动,那么Prefix RL则展示了AI在复杂逻辑设计上的创造力。


老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!


在芯片的算术逻辑单元(ALU)中,进位前瞻链(Carry Lookahead Chain)的放置是一个研究了几十年的经典难题。


人类工程师凭借经验和直觉进行布局,往往会达到一个性能瓶颈。


但Prefix RL系统给出了一份完全不同的答案。Dally形容,AI生成的布局是「人类永远无法想到的怪异设计」。


这些设计违背了传统电子工程的审美,但在性能表现上,却比人类最优设计提升了约20%到30%。


这标志着一个转折点:AI不再仅仅是人类的助手,它正在突破人类认知的边界,去寻找那些隐藏在数百万维空间中的「最优解」。


硅基导师Chip Nemo,让初级工程师「原地升级」


在英伟达内部,人力资源的错配曾是一个很大的隐痛:资深设计师往往需要花费大量时间指导新人,解释某个特定硬件模块(RTL)是如何工作的。


为了释放核心生产力,英伟达开发了内部大语言模型——Chip NemoBug Nemo


不同于市面上的通用LLM,这些模型基于英伟达数十年积累的专有架构文档、RTL代码和硬件规格进行微调。经过私有化训练,它们是「最懂英伟达GPU」的专家。


初级工程师遇到复杂的模块设计不再需要去打扰忙碌的高级工程师,而是直接询问Chip Nemo。它能像一位极具耐心的导师,条分缕析地解释GPU的工作原理。


Bug Nemo则负责汇总错误报告,自动将Bug分配给最合适的工程师或模块,极大地缩短了芯片验证这一「长跑阶段」的时间。


AI真的能完全自主「造芯」吗?


尽管效率提升了百倍,但Bill Dally在对话中依然保持了极其清醒的克制。


他明确指出,完全端到端的自动化芯片设计(即只需说一句「给我设计一个新GPU」,AI就吐出完整图纸)距离实现还有「很长的路要走」


目前,AI扮演的角色更像是「增强设计(Augmented Design)」,而非自主造芯。


其中有三大关键限制:


高层级架构决策仍依赖人类专家。


创造性电路设计和复杂逻辑结构仍需人工主导。


设计验证仍是整个流程中最长的「长杆」,AI只能辅助加速,无法完全闭环


也就是说,框架设定的部分,比如顶层的逻辑架构、跨模块的协调以及关键的决策,依然牢牢掌握在人类手中。


另外,虽然AI可以加速验证,但最终的模拟仿真和实际实验依然必不可少,以确保芯片在物理世界中万无一失。


英伟达的实践表明,AI并非淘汰工程师,而是重构工程师的工作方式。


初级工程师需要通过Chip Nemo自主学习复杂模块的工作原理,减少对资深工程师的打断。


资深工程师能从重复性任务中解放,专注于更高价值的创新和决策。


在整体流程上,AI负责大规模搜索、优化、验证,人类负责目标设定、约束定义、创意引导。


只是一种「人类设定框架 + AI极速执行」的协同模式。


而Dally构想的未来,是一个「多智能体(Multi-agent)」模型,不同的专业AI系统处理不同的设计环节,就像现在的各职能团队一样协作。


长期目标仍是端到端自动化设计,但需要克服验证、接口协商、动态调整等难题。


目前的进展已经让英伟达能够 更快地迭代下一代硬件,成为维持摩尔定律的重要支撑。


人类工程师,还不能被替代


当8名工程师10个月的工作被一块GPU的一夜取代时,我们不得不直面一个残酷的现实:平庸的体力型工程劳动正在迅速贬值。


英伟达正在构筑一道由AI驱动的技术壁垒。当竞争对手还在通过增加人力来追赶进度时,英伟达已经进入了「AI设计AI,AI优化AI」的自循环体系。


这种效率上的降维打击,正是其能够一年一更旗舰显卡的核心密码。


对于芯片工程师而言,这既是危机也是机遇。人类正从繁琐的布线、搬运单元中解脱出来,被迫向更高层级的架构思考、更复杂的创造性决策进化。


在硅基造芯的新纪元。在这里,计算不再仅仅是芯片的目的,计算已成为芯片诞生的源头。


参考资料:

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-says-ai-cuts-10-month-eight-engineer-gpu-design-task-to-overnight-job-company-is-still-a-long-way-from-ai-designing-chips-without-human-input

https://x.com/bearlyai/status/2043052190982639797


文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner