阿里通义千问发布多模态智能体模型Qwen3.7-Plus,让AI从“读懂世界”,走向“动手完成任务”。
阿里通义千问发布多模态智能体模型Qwen3.7-Plus,让AI从“读懂世界”,走向“动手完成任务”。今天,阿里通义千问发布多模态智能体模型Qwen3.7-Plus。相比传统“看图说话”式多模态模型,Qwen3.7-Plus在识别图像的基础上,进一步打通界面感知、工具调用、代码生成和任务交付,让AI从“读懂世界”,走向“动手完成任务”。
搜索
今天,阿里通义千问发布多模态智能体模型Qwen3.7-Plus。相比传统“看图说话”式多模态模型,Qwen3.7-Plus在识别图像的基础上,进一步打通界面感知、工具调用、代码生成和任务交付,让AI从“读懂世界”,走向“动手完成任务”。
今天,MuleRun正式上线Messages。作为MuleRun Enterprise版的AI协作IM,Messages的核心设计是让人类员工与AI Agent在同一个工作空间里像同事一样协作——Agent可以被@、可以被拉群、可以持续参与工作流程。
独家获悉,字节跳动多模态负责人周畅管理范围再次扩大,原由李航负责的 Seed Robotics 团队已向周畅汇报月余,李航现以顾问身份负责学术合作方向。字节也正在招聘具身智能技术负责人,负责机器人业务整体规划,职级定位为 L8,对标阿里 P10-P11,将向周畅汇报。该岗位候选人主要来自头部具身智能创业公司技术负责人。
6 月 2 日,具身智能公司星海图正式发布双足机器人「行客 Kengo」。这是星海图首次对外推出双足形态的机器人产品。按照星海图披露的信息,Kengo 身高 1.4 米,采用双足设计,头部搭载曲面屏。它的单关节扭矩超过 130N·m,可以完成舞蹈、互动等高动态动作;倒地跌落 10 次后仍可正常运行,线束折弯寿命超过 20 万次。
刚刚,OpenAI今晚直播预告,奥特曼或现身。明天,OpenAI将于美国东部时间上午举行「Intelligence at Work」直播活动,奥特曼将出席。随后,纳德拉将于美国东部时间下午发表Microsoft Build大会的开幕主题演讲。
距离今年的苹果全球开发者大会 WWDC 还有几天, 关于苹果新系统的爆料也已经越来越完整,外界几乎快提前「拼」出了今年的软件版图。
刚刚,顾全全发文告别字节 Seed 团队。在此之前,他是 Seed 旗下聚焦科学智能领域的 AI4S 团队核心成员。顾全全是机器学习理论、大模型对齐以及 AI4S 科学智能领域知名的学者。他于 2007 年和 2010 年分获清华大学自动化专业学士、控制科学与工程硕士学位,2014 年获伊利诺伊大学香槟分校计算机科学博士学位,随后在普林斯顿大学运筹与金融工程系(ORFE)开展统计学博士后研究。
“AI硬件现在还不是一个行业,而是一个方向。它落在工业、教育、医疗等具体场景里,才真正构成行业。”
浪潮之下,AI Agent正在猛力砸向一个万亿级市场。
中科院自动化所模式识别实验室开源MobileGym,运行在浏览器里的高并发安卓仿真平台,完全自定义,告别模拟器风控与真机成本,一个平台搞定Mobile Agent训练与评测,甚至还能玩原神!