AI资讯新闻榜单内容搜索-训练

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

大数据巨头Databricks与哥伦比亚大学最新研究发现，在数学和编程任务上，LoRA干不过全量微调。

来自主题: AI技术研报

4181 点击 2024-05-20 21:03

数据更多更好还是质量更高更好？这项研究能帮你做出选择

当计算预算低时，重复使用高质量数据更好；当不差钱时，使用大量数据更有利。

来自主题: AI技术研报

7820 点击 2024-05-20 18:52

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

前几天，普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型，论文提出构建完全可微的MoE模型，是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报

10940 点击 2024-05-20 16:10

哈佛大学朱科航：自动化社会科学Agent与人类行为建模 | Agent Insights

大语言模型可谓是迄今为止对人类行为最大的建模，如何借助大语言模型工具，让科技发展更好地应用到真实人类社会中去？从哈佛物理系到大语言模型结合社会学和经济学的研究，朱科航的思考路径，聚焦在对人类行为的深度学习和理解。在开始今天阅读之前，大家不妨先猜一猜，大语言模型之前人类应用最广的 TOP2 机器学习是什么？Enjoy

来自主题: AI资讯

10834 点击 2024-05-20 15:43