
浙大团队:AI让人缺乏动力、感到无聊!研究登上Nature子刊
浙大团队:AI让人缺乏动力、感到无聊!研究登上Nature子刊面对Ai,我们开始感到,无趣了,甚至,失去了原本的那股劲头。
面对Ai,我们开始感到,无趣了,甚至,失去了原本的那股劲头。
从春晚舞台上扭秧歌、转手绢,到稳健完整跑完半程马拉松…… 过去半年,一系列炫酷的表演,把人们对机器人的认知从想象拉进了现实。
6 月 17 日消息,尽管谷歌拥有庞大的云计算业务和大量人才,但在生成式人工智能竞赛中常常被视为处于劣势的一方。
6月16日,首都医科大学附属北京友谊医院(下简称“友谊医院”)与蚂蚁集团正式签署共建协议
LLM Ensemble(大语言模型集成)在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段,综合考虑并利用多个大语言模型(每个模型都旨在处理用户查询),从而发挥它们各自的优势。大语言模型的广泛可得性,以及其开箱即用的特性和各个模型所具备的不同优势,极大地推动了 LLM Ensemble 领域的发展。
GUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错了。
NVIDIA等研究团队提出了一种革命性的AI训练范式——视觉游戏学习ViGaL。通过让7B参数的多模态模型玩贪吃蛇和3D旋转等街机游戏,AI不仅掌握了游戏技巧,还培养出强大的跨领域推理能力,在数学、几何等复杂任务上击败GPT-4o等顶级模型。
由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收!这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。
美国国防部与OpenAI签订为期一年、价值2亿美元的合同,将采用其人工智能模型
随着大模型的不断发展,多模态数据处理成为了新的热点领域。多模态生成任务主要通过整合多种类型的数据,如文本、图像、音频等,实现不同模态之间的相互转换与生成。