AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

前几天,普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型,论文提出构建完全可微的MoE模型,是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报
10901 点击    2024-05-20 16:10
哈佛大学朱科航:自动化社会科学Agent与人类行为建模 | Agent Insights

哈佛大学朱科航:自动化社会科学Agent与人类行为建模 | Agent Insights

哈佛大学朱科航:自动化社会科学Agent与人类行为建模 | Agent Insights

大语言模型可谓是迄今为止对人类行为最大的建模,如何借助大语言模型工具,让科技发展更好地应用到真实人类社会中去?从哈佛物理系到大语言模型结合社会学和经济学的研究,朱科航的思考路径,聚焦在对人类行为的深度学习和理解。在开始今天阅读之前,大家不妨先猜一猜,大语言模型之前人类应用最广的 TOP2 机器学习是什么?Enjoy

来自主题: AI资讯
10799 点击    2024-05-20 15:43
替代MLP的KAN,被开源项目扩展到卷积了

替代MLP的KAN,被开源项目扩展到卷积了

替代MLP的KAN,被开源项目扩展到卷积了

本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。

来自主题: AI资讯
10991 点击    2024-05-19 16:25
华为最新研究挑战Scaling Law

华为最新研究挑战Scaling Law

华为最新研究挑战Scaling Law

“Scaling Law不是万金油”——关于大模型表现,华为又提出了新理论。

来自主题: AI资讯
6688 点击    2024-05-18 19:31
仅靠开源数据复刻出LLaMA3指令学习效果,在线迭代RLHF全流程解决方案来了

仅靠开源数据复刻出LLaMA3指令学习效果,在线迭代RLHF全流程解决方案来了

仅靠开源数据复刻出LLaMA3指令学习效果,在线迭代RLHF全流程解决方案来了

基于人类反馈的强化学习 (RLHF) 使得大语言模型的输出能够更加符合人类的目标、期望与需求,是提升许多闭源语言模型 Chat-GPT, Claude, Gemini 表现的核心方法之一。

来自主题: AI资讯
6728 点击    2024-05-18 11:18
吴恩达:四个步骤,让大模型变得更好

吴恩达:四个步骤,让大模型变得更好

吴恩达:四个步骤,让大模型变得更好

本周,生成式 AI 的竞争达到了新的高潮。

来自主题: AI资讯
10139 点击    2024-05-18 11:15
HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。

来自主题: AI技术研报
11515 点击    2024-05-17 17:49