老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

8249点击 2026-05-01 11:08

就在今天，这条消息全网刷屏了。

英伟达用AI设计GPU，原本需要8名资深工程师10个月才能完成的任务，一夜就完成了！

在刚刚过去的英伟达GTC大会上，首席科学家Bill Dally与谷歌首席科学家Jeff Dean的一场巅峰对话，揭露了令人震惊的这个事实。

现在，这个Youtube演讲已经有上万人观看，受到网友们的盛赞。

老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

在半导体行业的历史长河中，摩尔定律曾是不可逾越的真理，但随着物理极限的逼近，研发一款旗舰GPU的复杂程度已呈指数级增长。

但现在，英伟达的AI造芯神技，几乎让人类工程师彻底退居二线了？

老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

从「80个人月」到「一块GPU的一夜」

在传统芯片设计流程中，标准单元库（Standard Cell Library）的迁移是一项极度枯燥且耗时的重体力活。

每当台积电或三星推出新的半导体工艺（如从5nm跨越到3nm），英伟达必须将其包含约2500至3000个单元的基础库重新适配新工艺。

Bill Dally透露，过去这项任务需要一个由8名资深工程师组成的团队，连续奋斗10个月才能完成，总计耗费80个人月的人力成本。

但在AI介入后，这一切被彻底颠覆了！

现在，英伟达开发了一款基于强化学习的工具——NB-Cell。只需将需求输入系统，一块GPU在一夜之间即可完成全部迁移工作。

在这个过程中，NB-Cell通过不断的试错和自我优化，在极短时间内探索数以亿计的设计排列组合。

老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

令人震惊的是，AI生成的单元在尺寸（Area）、功耗（Power）和延迟（Delay）等核心指标上，不仅达到了人类水平，甚至在某些案例中优于人类的手工设计。

这种「隔夜交付」的能力，意味着英伟达可以比竞争对手更早地跑通新工艺，从而在硬件竞赛中始终保持身位领先。

老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

AI在芯片设计中的具体应用层次

逻辑重塑：Prefix RL与「非人类直觉」的布局

如果说NB-Cell解决的是重复性劳动，那么Prefix RL则展示了AI在复杂逻辑设计上的创造力。

老黄秘密武器曝光：AI一夜设计芯片，顶人类顶级工程师10个月！

在芯片的算术逻辑单元（ALU）中，进位前瞻链（Carry Lookahead Chain）的放置是一个研究了几十年的经典难题。

人类工程师凭借经验和直觉进行布局，往往会达到一个性能瓶颈。

但Prefix RL系统给出了一份完全不同的答案。Dally形容，AI生成的布局是「人类永远无法想到的怪异设计」。

这些设计违背了传统电子工程的审美，但在性能表现上，却比人类最优设计提升了约20%到30%。

这标志着一个转折点：AI不再仅仅是人类的助手，它正在突破人类认知的边界，去寻找那些隐藏在数百万维空间中的「最优解」。

硅基导师Chip Nemo，让初级工程师「原地升级」

在英伟达内部，人力资源的错配曾是一个很大的隐痛：资深设计师往往需要花费大量时间指导新人，解释某个特定硬件模块（RTL）是如何工作的。

为了释放核心生产力，英伟达开发了内部大语言模型——Chip Nemo和Bug Nemo。

不同于市面上的通用LLM，这些模型基于英伟达数十年积累的专有架构文档、RTL代码和硬件规格进行微调。经过私有化训练，它们是「最懂英伟达GPU」的专家。

初级工程师遇到复杂的模块设计不再需要去打扰忙碌的高级工程师，而是直接询问Chip Nemo。它能像一位极具耐心的导师，条分缕析地解释GPU的工作原理。

Bug Nemo则负责汇总错误报告，自动将Bug分配给最合适的工程师或模块，极大地缩短了芯片验证这一「长跑阶段」的时间。

AI真的能完全自主「造芯」吗？

尽管效率提升了百倍，但Bill Dally在对话中依然保持了极其清醒的克制。

他明确指出，完全端到端的自动化芯片设计（即只需说一句「给我设计一个新GPU」，AI就吐出完整图纸）距离实现还有「很长的路要走」。

目前，AI扮演的角色更像是「增强设计（Augmented Design）」，而非自主造芯。

其中有三大关键限制：

高层级架构决策仍依赖人类专家。

创造性电路设计和复杂逻辑结构仍需人工主导。

设计验证仍是整个流程中最长的「长杆」，AI只能辅助加速，无法完全闭环

也就是说，框架设定的部分，比如顶层的逻辑架构、跨模块的协调以及关键的决策，依然牢牢掌握在人类手中。

另外，虽然AI可以加速验证，但最终的模拟仿真和实际实验依然必不可少，以确保芯片在物理世界中万无一失。

英伟达的实践表明，AI并非淘汰工程师，而是重构工程师的工作方式。

初级工程师需要通过Chip Nemo自主学习复杂模块的工作原理，减少对资深工程师的打断。

资深工程师能从重复性任务中解放，专注于更高价值的创新和决策。

在整体流程上，AI负责大规模搜索、优化、验证，人类负责目标设定、约束定义、创意引导。

只是一种「人类设定框架 + AI极速执行」的协同模式。

而Dally构想的未来，是一个「多智能体（Multi-agent）」模型，不同的专业AI系统处理不同的设计环节，就像现在的各职能团队一样协作。

长期目标仍是端到端自动化设计，但需要克服验证、接口协商、动态调整等难题。

目前的进展已经让英伟达能够更快地迭代下一代硬件，成为维持摩尔定律的重要支撑。

人类工程师，还不能被替代

当8名工程师10个月的工作被一块GPU的一夜取代时，我们不得不直面一个残酷的现实：平庸的体力型工程劳动正在迅速贬值。

英伟达正在构筑一道由AI驱动的技术壁垒。当竞争对手还在通过增加人力来追赶进度时，英伟达已经进入了「AI设计AI，AI优化AI」的自循环体系。

这种效率上的降维打击，正是其能够一年一更旗舰显卡的核心密码。

对于芯片工程师而言，这既是危机也是机遇。人类正从繁琐的布线、搬运单元中解脱出来，被迫向更高层级的架构思考、更复杂的创造性决策进化。

在硅基造芯的新纪元。在这里，计算不再仅仅是芯片的目的，计算已成为芯片诞生的源头。

参考资料：

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-says-ai-cuts-10-month-eight-engineer-gpu-design-task-to-overnight-job-company-is-still-a-long-way-from-ai-designing-chips-without-human-input

https://x.com/bearlyai/status/2043052190982639797

文章来自于微信公众号 "新智元"，作者 "新智元"

关键词: AI新闻 , AI芯片设计 , Prefix RL , GPU

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner