AI资讯新闻榜单内容搜索-模型

RECURRENTGPT: 交互式生成（任意的）长文本

Transformer的固定尺寸上下文使得GPT模型无法生成任意长的文本。在本文中，我们介绍了RECURRENTGPT，一个基于语言的模拟RNN中的递归机制。

来自主题: AI技术研报

6099 点击 2024-02-06 12:51

「天工2.0」MoE大模型发布

「天工AI」国内首个MoE架构免费向C端用户开放的大语言模型应用全新问世。

来自主题: AI资讯

12557 点击 2024-02-06 12:48

亚马逊上线AI购物助手，可消费者会听AI的指挥吗

当AI大模型在2023年飞速成熟后，几乎每个行业都在尝试“AI赋能”，并希望AI能够化腐朽为神奇。

来自主题: AI资讯

11284 点击 2024-02-06 12:44

奖金十万美元！寻找数学能力最强大模型

2024开年伊始，一场震撼全球的AI竞赛即将拉开帷幕。

来自主题: AI资讯

6117 点击 2024-02-06 10:41

MiniCPM：揭示端侧大语言模型的无限潜力

MiniCPM 是一系列端侧语言大模型，主体语言模型 MiniCPM-2B 具有 2.4B 的非词嵌入参数量。

来自主题: AI技术研报

8739 点击 2024-02-05 14:42

比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

今天，穆罕默德・本・扎耶德人工智能大学 VILA Lab 带来了一项关于如何更好地为不同规模的大模型书写提示词（prompt）的研究，让大模型性能在不需要任何额外训练的前提下轻松提升 50% 以上。该工作在 X (Twitter)、Reddit 和 LinkedIn 等平台上都引起了广泛的讨论和关注。

来自主题: AI技术研报

6391 点击 2024-02-05 14:39