AI资讯新闻榜单内容搜索-模型

OpenAI，没有“王炸”

OpenAI发布了全能模型GPT-4o，在语音交互体验方面取得了重大突破。GPT-4o在响应速度上极大提升用户体验，几乎与人类相似。

来自主题: AI资讯

9863 点击 2024-05-14 10:12

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。

来自主题: AI技术研报

11964 点击 2024-05-13 17:28

OpenAI发布会前一天，员工集体发疯中……上演大型套娃行为艺术。

来自主题: AI技术研报

6119 点击 2024-05-13 17:25

猛然间，大模型圈掀起一股“降价风潮”。

来自主题: AI技术研报

9496 点击 2024-05-13 17:21

随着深度学习大语言模型的越来越火爆，大语言模型越做越大，使得其推理成本也水涨船高。模型量化，成为一个热门的研究课题。

来自主题: AI技术研报

5975 点击 2024-05-13 17:18

世界模型，即通过预测未来的范式对数字世界和物理世界进行理解，是通往实现通用人工智能（AGI）的关键路径之一。

来自主题: AI技术研报

11255 点击 2024-05-13 17:07

本文基于数势科技创始人&CEO黎科峰博士，百川智能联合创始人焦可，腾讯研究院副院长刘琼，蓝驰创投投资合伙人、TGO鲲鹏会学员石建平以及实在智能联合创始人、CMO张俊九等五位行业大咖在InfoQ主办的QCon全球软件开发大会的圆桌讨论整理。

来自主题: AI技术研报

10652 点击 2024-05-13 09:43

多模态 AI 无疑是今年大模型的发展重点之一，Sora、Midjourney、Suno 等文生视频、文生图、文生音乐赛道的代表产品也是用户的关注热点。

来自主题: AI资讯

9136 点击 2024-05-13 09:37

众所周知，大语言模型的训练常常需要数月的时间，使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例，其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性，导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报

7427 点击 2024-05-12 15:49

大模型回答如何更可靠？MIT研究团队设计出「共识博弈」，将数学家常用的博弈论引入LLM改进中。没想到，LLaMA-7B的表现，击败了LLaMA-65B，甚至与PaLM-540B相媲美。

来自主题: AI技术研报

8723 点击 2024-05-12 15:19