7月3日消息,在近期AMD Advancing AI 2025 大会上,吴恩达与苏姿丰就 AI 的普及、开放生态和硬件基础设施展开交流。两人强调,多层技术栈、快速原型和AI助编工具能大幅提升开发效率。
他们反驳“AI将取代程序员”的观点,认为未来软件开发更需技能升级与持续学习,鼓励开发者积极动手实践。在这场对话中,共同探讨和认可的核心观点如下:
以下是吴恩达、苏姿丰最新观点精华:
01 应用层决定AI能否真正“可及”
问:今天非常激动能和两位塑造AI未来的科技领袖进行交流。首先是斯坦福大学教授吴恩达,过去十多年里,他一直致力于普及AI教育。其次是AMD CEO苏姿丰,她致力于推动AI硬件普及,使更多的开发者能参与到AI计算中,推动了AI计算的发展。我们今天要探讨的核心话题是两位使命中都涉及的重要领域——AI的可及性。推动AI普及的关键因素是什么?最终如何有效且安全地加速AI进步?
吴恩达:我想分享一下我对AI普及的看法。我认为AI是一个“技术栈”,其中包括底层的半导体,比如AMD和英伟达的硬件,再到大型云服务商的支持,也就是超大规模的数据中心,最上层则是AI基础模型公司,如OpenAI、Gemini等。
实际上,世界上大多数人将会处于AI技术的应用层,利用各种工具和技术构建自己的应用。这是我工作的大部分时间所涉及的领域。虽然目前的媒体报道和宣传往往集中在技术层,但实际上,应用层才是最重要的,因为只有通过应用,我们才能为技术层创造价值,推动整个生态系统的发展。
AI的应用层比移动领域更加开放和创新,其中的一个原因是,移动领域存在两个“守门人”——Android和iOS,很多创新必须得到他们的许可才能进行或实现货币化。而在AI领域,我们的担忧是,某些技术栈的“守门人”可能会把控创新,最终将不公平的收益掌控在自己手中,从而限制了创新的空间。
在基础模型层面,开源和开放的权重模型至关重要。一些公司曾尝试通过游说来消除开源,显然是希望自己能够成为“守门人”。但幸运的是,随着时间的推移,这个威胁已经被化解。
对于我们而言,应用层必须保持开放,这是确保创新能够自由发展的前提。而在技术栈中,最有可能出现“守门人”的地方,恰恰是半导体层。因此,我们要特别关注软件栈生态的开放性,这确保了开发者在使用半导体硬件时拥有足够的选择权。只有这样,应用开发者才能在没有“守门人”的束缚下自由创新,不会被迫向某家公司寻求许可,也不会在开发过程中受到限制。
02 开放性决定创新空间
问:您能举个例子吗?比如说,某些应用会受到这种开放性的影响?
吴恩达:在我看来,开放性的问题在移动领域已经变得非常明显。比如,现在想要推出一款新的键盘应用,或者新的地图应用,甚至在美国推出一个新的语音助手,都是非常困难的。这些创新都受到移动平台“守门人”的限制,很难突破这些壁垒。
不过,我认为生成式AI目前仍处于一个相对早期的阶段。尽管一些“守门人”可能试图压制创新,但目前他们还没有足够的力量完全限制创新。我认为这是件好事。
例如,如果我们无法对模型进行微调,因为“守门人”掌控了这一点,那么我们就只能使用他们提供的模型,无法进行定制化的创新。而开放的创新生态系统则是一种非常强大的力量。比如,当DeepSeek模型刚发布几天后,它就已经在Qwen模型的基础上进行了蒸馏,生成了一个新的模型。我觉得这个过程非常有趣。
DeepSeek和Qwen这两个开放模型结合,形成了一个全新的模型。这种开放性促进了很多创新。
另外,Llama模型发布时,有些人认为它的上下文长度太短,但很快就有人对其进行了微调,发布了一个上下文窗口更长的新版本。这些都是开放性带来的好处。
同时,开放性还允许我们改变数据的输入格式,把原本只支持文本的模型扩展到能够处理图像的模型。这些创新已经在基础模型层得到了实现。
此外,在半导体互操作性、内核支持等基础设施层面,开放性也在为下一层技术的发展提供支持。因此,我认为开放性对于技术的持续发展至关重要。
苏姿丰:我对创新的速度感到非常惊讶,尤其是与DeepSeek和Llama相关的创新。实际上,这些零样本模型(zero-shot models)需要非常强大的基础设施支持,而我们的团队已经能够轻松地对这些模型进行优化。
坦率地说,大家也在非常迅速地将这些模型应用到实际中,不论是直接使用模型,还是借用其中的某些组件,大家都能迅速改善基础设施。
从基础设施的角度来看,我必须承认,开放源代码有时确实让人感到担忧,因为它并不完美。我认为,开源生态系统的核心是“信任”——尽管它不完美,但我们愿意开放源代码,正是希望大家能参与进来,让它变得更好。
当然,在半导体层面,我们必须尽可能快速地进行创新,这确实是非常复杂的工作。然而,我们要确保的是,尽量简化上层开发的工作,使其变得“即插即用”。这是我们所追求的目标:让你们在使用时有足够的选择性,而不受限制。
我们一直致力于实现这一目标,并持续优化我们的生态系统。虽然目前它还不完美,但它正在不断进步。
03 构建模块+编程助手助力AI应用加速落地
问:如何让开发者更好地参与到AI创新中,特别是当我们不断开放技术栈的更多部分时?你刚才提到很多人参与了Llama模型上下文窗口的扩展等等。但如果是底层的开发者,应该如何参与进来?
吴恩达:很多开发者都在技术栈的不同层面上开展工作。对于开发者来说,尽管他们中的大部分人可能更关注高层应用或服务,但如果他们能接触到GPU,尤其是在内核层面,他们就能更深入地了解开放的软件栈生态系统。
不过,如果我们聊到技术栈的上层,应用层的机会可以说是最令人兴奋的。过去几年里,两个重要的变化让这方面变得更加引人注目:
第一个是AI构建模块的崛起。现在,我们已经拥有了很多强大的工具,比如提示优化(prompting evals)、检索增强生成(RAG)、向量数据库、智能体工作流等等。这些模块让开发者可以将它们快速结合起来,创造出几年前根本无法实现的应用。所以,对于专注于应用层的开发者来说,学习如何使用这些工具,构建基于计算服务的应用,是一项非常值得追求的任务。
第二个令人兴奋的进展是AI编程助手的进化。说实话,像我自己,现在几乎无法想象没有AI助手的编程生活。AI编程助手的工具和技术的演变,已经成为整个AI行业发展最快的领域之一。虽然我们常说“发展很快”,但坦率地讲,AI编程助手的创新速度,确实是其他行业难以匹敌的。
回顾过去的两三年,2002年GitHub Copilot的推出,开启了自动补全代码的新纪元。随后,随着Windsurf生成技术的出现,代码自动化的程度进一步提升,支持更复杂的智能体工作流。当然,这种技术有时也会带来bug,但不可否认的是,它在飞速发展。如今,最新的AI编程助手已经变得更智能、更高效。
作为开发者,我们站在这些技术趋势的前沿,已经开始切身感受到它们的帮助,尤其是在维护旧有软件时。而我个人花最多时间的地方,其实是在快速开发和构建原型。我们已经创办了许多初创公司。如今,当我有了新的创意,发现很多事情可以在一个下午完成,而几年前,可能需要六个工程师三个月才能实现。
过去,很多概念验证工作往往因为投入精力过多却没有进入生产阶段而被放弃。但现在,这种担忧对我来说不再重要。我更关注的是如何将概念验证的成本降到足够低。
如今,无论是初创公司还是大企业,创新过程都在发生变化。大家都在利用快速原型开发的能力发明新事物,并探索哪些创新真正有效,尤其是在应用层面,这一切都令人非常兴奋。为了确保这种创新的热情得以持续,确保我们都能不断创新,而不被“守门人”束缚,就必须保持技术层的开放性。这将是支撑应用创新持续发展的关键。
04 “别学编程”?这是AI时代最糟糕的职业建议之一
问:很多人担心,AI会自动化开发者所写的代码,他们该何去何从?同时,AI也带来了哪些新的机会?
吴恩达:早在今年年初甚至是去年,一些人就开始建议不要再学写代码,认为AI会自动化这一过程。但我认为,这种建议将来会被视为最糟糕的职业建议之一。
因为当一项工作变得更加容易时,反而应该有更多的人去做,而不是减少做这项工作的人数。
就像从打孔卡片到键盘的转变一样,编程变得更容易,更多的人开始参与其中。当人们从汇编语言转向COBOL时,曾有人说,“COBOL编程变得如此简单,看起来我们不再需要程序员了。”但事实上,情况正好相反。随着AI辅助编程的普及,应该有更多的人参与编程工作。
编程的需求实际上是没有上限的。随着软件工程成本的下降,我们将看到越来越多伟大的软件问世。但与此同时,软件工程的方式也在发生变化。
我们现在看到一种新的刻板印象——“一个新毕业的大学生能超越一个有十年经验的全栈工程师”。这是真的,因为新毕业的大学生对于AI技术非常熟悉,而那些经验丰富的工程师可能还在用2022年以前的技术,跟不上新技术的步伐。
然而,另一个被忽视的事实是,最优秀的工程师并不是刚刚毕业的大学生,尽管我对他们并无偏见。实际上,是那些有着丰富经验、深入理解架构和计算机思维框架的工程师,他们不仅理解架构,还不断学习并跟进AI技能。
我知道最近有一种令人焦虑的现象:找工作变得越来越难,尤其是对于计算机科学专业的新毕业生。一方面,很多公司表示找不到足够的GenAI应用开发者——这些是能够快速使用AI编码助手、掌握构建模块并快速创建高价值应用的开发者。
但遗憾的是,许多教育体系,特别是大学的课程更新速度跟不上这些变化,导致技能与市场需求之间出现了脱节。未来我们需要编写更多的软件,但最大的挑战在于,如何帮助开发者甚至非开发者提升技能,教会他们如何使用这些工具,从而大大提高他们的生产力。
苏姿丰:在我们的工作流程中,无论是硬件开发、软件开发,还是销售、市场营销、人力资源等领域,都在使用AI。其中的事实是,我们仍然需要更多的人才。
有人认为AI会取代所有工作,这种观点显然不准确。对我们来说,真正的目标是如何更快地将更多的产品推向市场。
我想强调的是,使用AI越多,你就会变得越有能力,越高效,工程方面的产出就会越来越好。我们会看到更多的创新和生产力提升。我完全赞同继续教育的重要性,保持学习的节奏非常关键,这能帮助我们更快地掌握新技术,进步更迅速。
问:开发者应该如何行动起来?
吴恩达:对我来说,人生中最重要的教训之一就是——你有权去做任何事。只要不伤害别人,不造成损害,你完全可以去尝试任何事情。
在今天的世界里,借助AI辅助编程工具和强大的AI构建模块,个人可以完成的项目数量和种类已经爆炸性增长。因此,我认为现在正是一个非常适合去构建东西的时机。
如果你做出来的东西不完美,没关系,继续做下去。从中学到的教训会让你不断进步。甚至有时,你会在某个小领域找到突破口,然后继续做下一个项目。
我发现,很多我做过的最好的项目,包括Coursera,最开始也只是一个副项目。当时我还是斯坦福的教授,我也在想:“我这么忙,能做这些在线教育的事情吗?
大家似乎也不太关心。”但是我决定去做,哪怕没人关注。
所以,我想说的是,现在是史上最容易构建非凡事物的时刻。去做吧,去构建,去创造!
文章来自“腾讯科技”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0