老黄惊喜现身,与95后清华校友合影曝光,确认Banghua Zhu加入Star Nemotron团队,专注企业级智能体研发。同时Jiantao Jiao官宣入职英伟达。两人曾联合创办Nexusflow。
就在刚刚,行踪一向神秘的老黄终于出现了!
他与两位华人在同一地点的合影,登上热搜,而且这次老黄并没有穿着他那标志性的皮衣。
老黄这次「悄悄地」将这两位华人AI大神收入麾下。
两人的评论区都是各种大佬的恭喜,看都看不过来。
通过比对照片背景,我们发现拍摄地点很大概率就在NVIDIA位于加州圣克拉拉总部园区的 「Voyager」大楼。(但尚未获得官方确认。)
老黄的英伟达似乎正在酝酿什么大事件?
这两位华人大神的背景都非常硬核,并且共同创办了一家公司Nexusflow,致力于为企业构建智能体。
Banghua Zhu是华盛顿大学电子与计算机工程系(ECE)助理教授,并在计算机科学与工程系(CSE)兼任教职。
他曾在2023年联合创立了Nexusflow AI。
这一次他以首席研究科学家的身份加入英伟达的研究部门的Star Nemotron团队。
Star Nemotron团队在英伟达专注于企业级智能体构建,算是「专业对口」了。
Jiantao Jiao是加州大学伯克利分校电子工程与计算机科学系(EECS)和统计系的助理教授。同时也是伯克利CLIMB的联合主任,以及BAIR Lab、BLISS和RDI的成员。
值得一提的是,他还是上文提到的Nexusflow的联合创始人兼CEO。
如果继续深挖两位华人专家的背景和经历,也许能得出一个结论。
老黄这次也下场在AI领域「抢人了」。
Banghua Zhu是华盛顿大学电子与计算机工程系(ECE)助理教授,并在计算机科学与工程系(CSE)兼任教职。
他曾在2023年联合创立了Nexusflow AI,致力于为企业级应用场景提供可靠的AI智能体解决方案。
此前,他在加州大学伯克利分校电子工程与计算机科学系(EECS)获得博士学位,师从Jiantao Jiao教授和Michael I. Jordan教授。
并在清华大学获得电气与电子工程学士学位。
凭借着杰出的博士科研工作,他还荣获了伯克利颁发的2023年度David J. Sakrison纪念奖。
他目前的研究方向包括基础模型的理论基础、训练、服务、评估与应用。
此外,他也长期致力于统计学、信息论和机器学习领域,及其在博弈论、稳健统计、强化学习和人机交互等方向的应用。
如今堪称「最权威」LLM评测的LMArena,他就是创始作者之一。
论文地址:https://arxiv.org/pdf/2403.04132
成果介绍
在模型训练、评估方面和理论基础等研究上,Banghua Zhu的成果颇丰。
在模型训练方面:
Starling-7B
Athene系列
在模型评估方面:
在理论基础方面:
在模型服务方面:
Jiantao Jiao是加州大学伯克利分校电子工程与计算机科学系(EECS)和统计系的助理教授。同时也是伯克利CLIMB的联合主任,以及BAIR Lab、BLISS和RDI的成员。
他同时也是上文提到的Nexusflow的联合创始人兼CEO。
此前,他在斯坦福大学获得博士学位。
他最近的研究重点是生成式AI与基础模型,涵盖了从数据策管、预训练、有监督微调、指令微调、基于人类反馈的强化学习(RLHF)、模型推理,到构建防御「越狱」和「提示词注入」攻击的安全护栏等全链条技术。
此外,他也对统计机器学习、优化、机器学习系统的隐私与安全、强化学习、机器学习的经济学视角,及其在自然语言处理、代码生成、计算机视觉、自动驾驶和机器人等领域的应用有广泛兴趣。
老黄为何要招募这两位华人?也许老黄不想仅仅只卖GPU!
英伟达的下一步是提供端到端的智能体解决方案——软硬通吃。
NVIDIA此前在GTC上推出的Nemotron系列,主打多模态推理、函数调用和工具链接口能力。
细分Nano/Super/Ultra三档算力梯度,旨在给开发者与企业提供「业务级」Agent底座。
这两位华人都是在企业级智能体领域创业多年,并且横跨学术界和产业界,也许正是英伟达模型训练急需的人才。
并且,老黄此前就表示过,他真的看好华人,他说:
中国人工智能研究人员是「世界级」的——美国公司正在雇佣「大量」此类人才。
估计是眼看人才都要被抢光了,老黄也赶紧出手了。
如果再结合此前何恺明入职谷歌、Meta挖走OpenAI苏黎世团队、小扎还不断挖OpenAI的墙角等事件。
这场AI的抢人大战,也许才刚刚开始。
参考资料:
https://www.linkedin.com/in/banghua-zhu-171902aa/
https://www.linkedin.com/in/prof-jiantao-jiao/
文章来自于微信公众号“新智元”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0