引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。
图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。
对于专业应用和创意工作流来说,除了高质量的形状和纹理,更需要可以独立操作的「零部件级3D模型」。为此,Meta与牛津大学的研究人员推出了全新的多视图扩散模型。
1 月 18 日,北京,聊聊 2025 如何加入技术开发? AI 科技评论消息称,前微软亚洲研究院视觉计算组首席研究员胡瀚,不久前加入腾讯,接替已离职的前腾讯混元大模型技术负责人之一的刘威,负责多模态大模型的研发工作。
大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。
1/10训练数据激发高级推理能力!近日,来自清华的研究者提出了PRIME,通过隐式奖励来进行过程强化,提高了语言模型的推理能力,超越了SFT以及蒸馏等方法。
做出卓越的研究成果是否真需要博士学位?4位杰出研究员的经历向我们展示了:能力、实践经验和创新精神或许比学位更为重要,但对于大多数人来说,学位依然是打开许多机会大门的关键。
现在,大模型可以帮你梳理新闻时间线了,以后吃瓜就更方便了! AI Agent的风,咱们赛博乐子人也得吹吹。 这就是来自阿里巴巴通义实验室与上海交通大学的新研究,他们提出了一种基于Agent的新闻时间线摘要新框架——CHRONOS。
在人工智能快速发展的今天,单一大模型在处理复杂任务时的局限性日益凸显。微软研究院最新发布的Magentic-One系统,通过创新性的多智能体协作架构,展示了突破这一瓶颈的新方向。
在当今瞬息万变的市场中,对于旨在最大化回报的企业而言,了解应重点关注哪些客户至关重要。
OpenAI o1和o3模型的秘密,竟传出被中国研究者「破解」?今天,复旦等机构的这篇论文引起了AI社区的强烈反响,他们从强化学习的角度,分析了实现o1的路线图,并总结了现有的「开源版o1」。