
浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误
浙大&港理工等提出InfiGUI-R1:利用强化学习,让GUI智能体学会规划任务、反思错误当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要复杂规划和错误恢复的任务时常常力不从心。
当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要复杂规划和错误恢复的任务时常常力不从心。
南加州大学团队只用9美元,就能在数学基准测试AIME 24上实现超过20%的推理性能提升,效果好得离谱!而其核心技术只需LoRA+强化学习,用极简路径实现超高性价比后训练。
大模型竞技场的可信度,再次被锤。
Hi,我想先请你只看下面这张照片,推测它的拍摄城市:
近日,ISCA Fellow 2025 入选结果揭晓!
这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。
LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。
随着技术成熟度提升,以及人们逐渐认识到AI节省时间与成本的潜力,预计将涌现大批面向消费者的AI产品,实现全流程任务代劳。
日前,诺奖得主、AI教父Geoffrey Hinton联合10名前OpenAI员工及其他业内人士联合发表公开信反对OpenAI的重组计划,理由非常直接:OpenAI违背了他们的慈善宗旨,即确保AGI的安全开发和造福人类。
昆仑自研的AI模型(SOTA)就像是“最好的锄头”,正在助力公司开采AIGC领域那片“最肥沃的金矿”。