AI资讯新闻榜单内容搜索-模型

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科学问题正确率提高28%

最近，一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后，一个仅80亿参数的小模型，在科学问题上也能和GPT-4o一较高下！或许，单纯地卷AI计算能力并不是唯一的出路。

来自主题: AI技术研报

8309 点击 2024-12-02 15:53

智能客服，不再智障？

智能客服行业掀起了一股大模型热。 “现在客户上来就问能用大模型打电话吗？如果没有大模型能力，客户就不跟你聊了”，云蝠智能CEO魏佳星告诉数智前线，市场对大模型客服的认知度在加速。

来自主题: AI资讯

5975 点击 2024-12-02 15:42

让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命｜NeurIPS 2024

研究人员提出了一种方法，能够在领域数据分布持续变化的动态环境中，基于随机时刻观测的数据分布，在任意时刻生成适用的神经网络，实现前所未有的泛化能力。

来自主题: AI技术研报

7471 点击 2024-12-02 15:25

图结构转文本序列，大模型直接读懂！图推理性能大涨

大语言模型直接理解复杂图结构的新方法来了：

来自主题: AI技术研报

7338 点击 2024-12-02 14:57

微软：两个AI相互纠错，数学再涨5分

提升LLM数学能力的新方法来了——

来自主题: AI技术研报

5130 点击 2024-12-02 14:51

NeurIPS 2024｜杜克大学&谷歌提出SLED解码框架，无需外部数据与额外训练，有效缓解大语言模型幻觉，提高事实准确性

大语言模型（LLM）在各种任务上展示了卓越的性能。然而，受到幻觉（hallucination）的影响，LLM 生成的内容有时会出现错误或与事实不符，这限制了其在实际应用中的可靠性。

来自主题: AI技术研报

8391 点击 2024-12-02 14:27

NeurIPS 2024 | 数学推理场景下，首个分布外检测研究成果来了

本文将介绍数学推理场景下的首个分布外检测研究成果。

来自主题: AI技术研报

2749 点击 2024-12-02 14:14

DeepMind用语言游戏让大模型学AlphaGo自我博弈，数据限制不存在了

自我博弈，很神奇吧？

来自主题: AI技术研报

3971 点击 2024-12-02 14:01

美欧亚三洲开发者联手，全球首个组团训练的大模型来了，全流程开源

Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号，他们开源了一切，包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解，这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。

来自主题: AI资讯

7021 点击 2024-12-02 12:35

谷歌推出医疗AI的安卓系统-基础模型未来已来！

Google研究院健康AI团队于近日推出了全新的开源模型套件——Health AI Developer Foundations（HAI-DEF）。在本次HAI-DEF的首次发布中，Google推出了三个专注于医疗影像应用的重要模型。首先是CXR Foundation胸部X光模型，其次是Derm Foundation皮肤影像模型，第三个是Path Foundation病理学模型，它基于ViT-S架构

来自主题: AI技术研报

7148 点击 2024-12-02 10:52