AI资讯新闻榜单内容搜索-训练

「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线

大语言模型（LLM），通过在海量数据集上的训练，展现了超强的多任务学习、通用世界知识目标规划以及推理能力

来自主题: AI资讯

6296 点击 2024-04-11 22:45

智东西4月11日报道，美国AI三巨头不仅在大模型赛道争奇斗艳，还纷纷卷起自研AI芯片。

来自主题: AI资讯

8337 点击 2024-04-11 21:59

Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手，目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件，特别是用于运行和训练 Meta AI 模型的芯片

来自主题: AI资讯

5803 点击 2024-04-11 21:07

一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」

来自主题: AI资讯

7253 点击 2024-04-11 20:53

大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测，超越一切传统时序模型。

来自主题: AI资讯

8146 点击 2024-04-11 17:25

谁能想到，只是让大模型讲笑话，论文竟入选了顶会CVPR！

来自主题: AI资讯

10380 点击 2024-04-11 17:20

技术阿甘在不停奔跑。

来自主题: AI资讯

9160 点击 2024-04-11 16:15

纯C语言训练GPT，1000行代码搞定！，不用现成的深度学习框架，纯手搓。发布仅几个小时，已经揽星2.3k。

来自主题: AI资讯

7968 点击 2024-04-11 10:18

近日，朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3：知识的 Scaling Laws》用海量实验（50,000 条任务，总计 4,200,000 GPU 小时）总结了 12 条定律，为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯

6468 点击 2024-04-10 19:11

对代码大模型而言，比能做编程题更重要的，是看是能不能适用于企业级项目开发，是看在实际软件开发场景中用得顺不顺手、成本高不高、能否精准契合业务需求，后者才是开发者关心的硬实力。

来自主题: AI资讯

7474 点击 2024-04-10 17:50