AI资讯新闻榜单内容搜索-GPT-4

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。

来自主题: AI技术研报

10039 点击 2024-06-04 17:45

多模态模型学会打扑克：表现超越GPT-4v，全新强化学习框架是关键

只用强化学习来微调，无需人类反馈，就能让多模态大模型学会做决策！

来自主题: AI技术研报

10390 点击 2024-06-04 17:23

全球最强GPU芯片已量产、下一代Rubin曝光，老黄继续打破摩尔定律

黄仁勋：我家的 GPU 芯片一年一更新，其他家怎么追？

来自主题: AI资讯

9482 点击 2024-06-03 17:44

OpenAI把GPT-4原始版给了他们：研究不微调只靠提示词能走多远

除了OpenAI自己，居然还有别人能用上GPT-4-Base版？？

来自主题: AI技术研报

9165 点击 2024-06-03 15:46

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象

来自主题: AI技术研报

10366 点击 2024-06-03 15:39

超越Devin！姚班带队，他们创大模型编程新世界纪录

超越Devin！SWEBench排行榜上迎来了新玩家

来自主题: AI资讯

9756 点击 2024-06-03 15:34

老黄一口气解密三代GPU！粉碎摩尔定律打造AI帝国，量产Blackwell解决ChatGPT全球耗电难题

刚刚，老黄又高调向全世界秀了一把：已经量产的Blackwell，8年内将把1.8万亿参数GPT-4的训练能耗狂砍到1/350；英伟达惊人的产品迭代，直接原地冲破摩尔定律；Blackwell的后三代路线图，也一口气被放出。

来自主题: AI技术研报

9800 点击 2024-06-03 10:48

ChatGPT 负责人：GPT-4 越来越聪明是因为 post-traning，大模型短期没有数据瓶颈

John Schulman 是 OpenAI 联合创始人、研究科学家（OpenAI 现存最主要具有技术背景的创始人），他领导了 ChatGPT 项目，在 OpenAI 内部长期负责模型 post-traning，在 Ilya 和 Jan Leike 离开 OpenAI 后，下一代模型安全性风险相关的研究也会由 John Schulman 来接替负责。

来自主题: AI资讯

9373 点击 2024-06-01 19:11

谷歌DeepMind：GPT-4高阶心智理论彻底击败人类！第6阶推理讽刺暗示全懂了

刚刚，谷歌DeepMind、JHU、牛津等发布研究，证实GPT-4的心智理论已经完全达到成年人类水平，在更复杂的第6阶推理上，更是大幅超越人类！此前已经证实，GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上，人类是彻底被LLM甩在后面了。

来自主题: AI技术研报

9813 点击 2024-06-01 18:04

AI化身恋爱军师，大模型分析爱情靠谱吗?

GPT-4o充当恋爱军师，追谁都能隔层纱

来自主题: AI资讯

10793 点击 2024-06-01 17:46