AI资讯新闻榜单内容搜索-模型

大模型营销战，“砸钱”能缓解商业化焦虑？

AI应用贴脸营销，广告平台赚翻了。

来自主题: AI资讯

8824 点击 2024-08-31 15:46

智谱AI的“类GPT-4o”，让我看到了作业帮、小红书、下厨房的影子

智谱AI发布新视觉模型，看得懂视频，也看得透网页源代码。

来自主题: AI资讯

9811 点击 2024-08-31 15:37

OpenCity大模型预测交通路况，零样本下表现出色，来自港大百度

长时间交通状况预测，可以用大模型实现了。

来自主题: AI技术研报

9970 点击 2024-08-31 15:30

GPT-4o mini排名雪崩，大模型竞技场规则更新，奥特曼刷分小技巧无效了

大模型竞技场规则更新，GPT-4o mini排名立刻雪崩，跌出前10。

来自主题: AI技术研报

9441 点击 2024-08-31 15:19

当奖励成为漏洞：从对齐本质出发自动「越狱」大语言模型

本文第一作者为香港大学博士研究生谢知晖，主要研究兴趣为大模型对齐与强化学习。

来自主题: AI技术研报

7815 点击 2024-08-31 15:09

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解。然而，注意力机制的缺点是计算开销大，会随输入规模而二次增长，Transformer 也因此难以处理非常长的文本。

来自主题: AI技术研报

9528 点击 2024-08-31 14:54

智算中心，建设热潮的尽头是产业运营

8月28日至30日，2024中国国际大数据产业博览会正在贵阳火热进行中。“产业链上下游的人都来了。”一位行业人士观察，与以往不同，这届数博会上，数据要素、智算基础设施建设，正在和智能化、大模型行业应用等一起成为被密集讨论的话题。

来自主题: AI资讯

4857 点击 2024-08-31 14:43

估值160亿的燧原启动上市，终于又有国产芯片公司要IPO了

大模型带动生成式AI爆发后，对算力的高需求让芯片巨头英伟达的订单量、收入、股价一路走高，而国内芯片厂商却一直处于蛰伏状态。

来自主题: AI资讯

6379 点击 2024-08-31 14:10

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

9536 点击 2024-08-31 11:19

一手实测结果出炉！智谱「超大杯」模型全家桶亮相KDD，部分任务超越GPT-4o

在与 GPT-4o 的全面较量中，GLM-4-Plus 已经可以在大多数任务上做到逼近甚至在某些任务上实现了超越。还有 One More Thing：清言上线了视频通话功能，首批面向部分用户开放。

来自主题: AI资讯

10347 点击 2024-08-31 10:38