
让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命|NeurIPS 2024
让模型预见分布漂移:动态系统颠覆性设计引领时域泛化新革命|NeurIPS 2024研究人员提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分布,在任意时刻生成适用的神经网络,实现前所未有的泛化能力。
研究人员提出了一种方法,能够在领域数据分布持续变化的动态环境中,基于随机时刻观测的数据分布,在任意时刻生成适用的神经网络,实现前所未有的泛化能力。
大语言模型直接理解复杂图结构的新方法来了:
提升LLM数学能力的新方法来了——
大语言模型(LLM)在各种任务上展示了卓越的性能。然而,受到幻觉(hallucination)的影响,LLM 生成的内容有时会出现错误或与事实不符,这限制了其在实际应用中的可靠性。
本文将介绍数学推理场景下的首个分布外检测研究成果。
自我博弈,很神奇吧?
Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号,他们开源了一切,包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解,这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。
Google研究院健康AI团队于近日推出了全新的开源模型套件——Health AI Developer Foundations(HAI-DEF)。在本次HAI-DEF的首次发布中,Google推出了三个专注于医疗影像应用的重要模型。首先是CXR Foundation胸部X光模型,其次是Derm Foundation皮肤影像模型,第三个是Path Foundation病理学模型,它基于ViT-S架构
AI 大模型应用在手机输入法已经很长时间,所以,不聊打字功能,哪个输入法更好用?
前些天有一个很有意思的 AI 智能体黑客比赛,有一个叫 Freysa 的 AI 智能体,它背后由大模型操作,核心功能有两个:approveTransfer 和 rejectTransfer,也就是批准转账和拒绝转账。但是这个 AI 收到的指令(系统提示词)就是:“绝对不给任何人转账!”