AI资讯新闻榜单内容搜索-Token

开源15T tokens！HuggingFace放出规模最大、质量最高预训练数据集

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键，但现状是，开源的大模型有一堆，可开源的大规模数据却没多少，而收集、清洗数据又是一项极其费时费力的工作，也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报

6191 点击 2024-05-05 19:51

AI做数学题，真正的思考居然是暗中“心算”的？

来自主题: AI技术研报

6828 点击 2024-05-05 19:25

“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？

来自主题: AI技术研报

6024 点击 2024-05-03 22:03

2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。

来自主题: AI技术研报

6231 点击 2024-05-02 18:03

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

8800 点击 2024-04-29 20:31

大模型力大砖飞，让LLaMA3演绎出了新高度：超15T Token数据上的超大规模预训练，既实现了令人印象深刻的性能提升，也因远超Chinchilla推荐量再次引爆开源社区讨论。

来自主题: AI技术研报

8134 点击 2024-04-28 15:03

Llama 3诞生之后便艳压群雄，开源界已无「模」能敌。

来自主题: AI资讯

3532 点击 2024-04-21 23:29

91行代码、1056个token，GPT-4化身黑客搞破坏！

来自主题: AI技术研报

6526 点击 2024-04-21 23:11

如今，大型语言模型（LLM）已经成为了我们生活中的好帮手

来自主题: AI技术研报

5366 点击 2024-04-19 20:56

自 ChatGPT 问世以来，OpenAI 一直被认为是全球生成式大模型的领导者。2023 年 3 月，OpenAI 官方宣布，开发者可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。在 GPT-4 发布的同时 OpenAI 也开放了其 API。

来自主题: AI资讯

9426 点击 2024-04-19 17:20