据 AI 科技评论报道,前阿里通义实验室视觉负责人薄列峰已正式加盟腾讯混元大模型团队,直接向腾讯副总裁、混元项目负责人蒋杰汇报,主要负责多模态方向的技术攻坚。
早在今年4月30日,薄列峰从阿里离职,外界曾一度传出他将赴美加入某大型科技公司,统筹多模态AI研发。如今尘埃落定,他最终选择落脚深圳,加入国内多模态竞争最激烈的战场之一。
薄列峰是AI 多模态领域的资深专家,其学术与工业背景横跨深度学习爆发前后。他于 2007 年获西安电子科技大学电气工程博士学位,后赴芝加哥大学丰田研究院、华盛顿大学从事博士后研究,主攻机器学习、计算机视觉与机器人方向。
2013 年加入亚马逊西雅图总部任首席科学家期间,他作为 Amazon Go 无人零售项目的核心创始成员,主导了第二代算法架构研发,推动计算机视觉与传感器融合技术落地。2017 年转战京东数科任 AI 实验室首席科学家,2022 年加入阿里接替谭平执掌达摩院 XR 实验室,后调任通义实验室负责应用视觉团队,成为阿里文生视频、图像生成等 AIGC 技术的关键架构者。
在阿里期间,薄列峰领导团队推出多项行业标杆成果:包括人物动作生成框架Animate Anyone(支撑全民舞王功能)、一键换装技术 Outfit Anyone,以及今年初发布的语音驱动肖像视频框架 EMO(Emote Portrait Alive),相关技术已落地通义千问 APP,并在社交平台引发破亿级传播。
其主导的四大人物视频生成框架(动作、换装、替身、唱演)在 2024 中国生成式 AI 大会上被重点展示,被视为阿里应对 Sora 竞争的核心技术壁垒。
值得关注的是,薄列峰并非近期唯一离职的通义高管。
2 月 15 日,通义实验室语音团队负责人鄢志杰(P10)亦低调加入某大厂任 AI Lab 副主任,但不足三月便因架构调整离职。
此外,阿里云前副总裁叶杰平近期以之江实验室副主任身份公开亮相,而之江实验室主任正为阿里云创始人王坚,人事变动背后的技术战略调整耐人寻味。
此前,有公开报道称,字节跳动以高薪挖走了原阿里通义大模型技术团队的关键成员,包括技术负责人周畅及其手下的十多名团队成员。据了解,通义方面已对周畅提起劳动仲裁,指控其违反竞业协议,索赔金额不菲。这一次,薄列峰恐怕也要面对这道“竞业关”。
业内人士分析,薄列峰的离职或与阿里大模型业务重组有关。自2023 年起,通义千问逐步整合达摩院多个实验室资源,技术路线从分散转向集中,组织架构频繁调整可能导致核心人才流失。另一方面,字节、华为等企业对 AI 人才的争夺日趋激烈,据脉脉数据,字节已连续四年位列 AI 岗位新增量榜首,大模型人才薪资均值超 5 万元/月。
文章来自微信公众号 “ Z Finance ”