AI资讯新闻榜单内容搜索-语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 语言模型

LLM性能最高60%提升！谷歌ICLR 2024力作：让大语言模型学会「图的语言」

LLM性能最高60%提升！谷歌ICLR 2024力作：让大语言模型学会「图的语言」

LLM性能最高60%提升！谷歌ICLR 2024力作：让大语言模型学会「图的语言」

图是组织信息的一种有用方式，但LLMs主要是在常规文本上训练的。谷歌团队找到一种将图转换为LLMs可以理解的格式的方法，显著提高LLMs在图形问题上超过60%的准确性。

来自主题: AI资讯

6614 点击 2024-03-27 17:52

讨论下一个token预测时，我们可能正在走进陷阱

讨论下一个token预测时，我们可能正在走进陷阱

讨论下一个token预测时，我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后，这一概念逐渐成为现代语言模型的核心部分。最近，围绕下一个 token 预测的讨论日趋激烈。

来自主题: AI资讯

6692 点击 2024-03-25 17:05

马斯克加入了开源大模型阵营

马斯克加入了开源大模型阵营

马斯克加入了开源大模型阵营

特斯拉创始人埃隆·马斯克推出了开源大语言模型Grok-1，该模型参数量高达3140亿，是迄今为止参数量最大的开源大模型。

来自主题: AI资讯

4417 点击 2024-03-24 15:51

如何从头开始编写LoRA代码，这有一份教程

如何从头开始编写LoRA代码，这有一份教程

如何从头开始编写LoRA代码，这有一份教程

作者表示：在各种有效的 LLM 微调方法中，LoRA 仍然是他的首选。LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报

7000 点击 2024-03-20 16:16

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

早在 2020 年，陶大程团队就发布了《Knowledge Distillation: A Survey》，详细介绍了知识蒸馏在深度学习中的应用，主要用于模型压缩和加速。随着大语言模型的出现，知识蒸馏的作用范围不断扩大，逐渐扩展到了用于提升小模型的性能以及模型的自我提升。

来自主题: AI技术研报

4992 点击 2024-03-16 15:28

苹果首次披露多模态大模型，AI大招什么时候上iPhone

苹果首次披露多模态大模型，AI大招什么时候上iPhone

苹果首次披露多模态大模型，AI大招什么时候上iPhone

苹果首次披露了在多模态大型语言模型（LLM）研究领域的最新突破，并在生成式AI领域“开辟新天地”。探索生成式AI领域，将AI技术引入iPhone

来自主题: AI资讯

2317 点击 2024-03-16 11:02

LLaMA-2-7B数学能力上限已达97.7%？Xwin-Math利用合成数据解锁潜力

LLaMA-2-7B数学能力上限已达97.7%？Xwin-Math利用合成数据解锁潜力

LLaMA-2-7B数学能力上限已达97.7%？Xwin-Math利用合成数据解锁潜力

数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。

来自主题: AI技术研报

7914 点击 2024-03-14 16:14

用大模型测试人格/抑郁/认知模式！通过游戏剧情发展测量心理特质｜清华出品

用大模型测试人格/抑郁/认知模式！通过游戏剧情发展测量心理特质｜清华出品

用大模型测试人格/抑郁/认知模式！通过游戏剧情发展测量心理特质｜清华出品

随着大语言模型（LLM）的发展，很多研究发现LLM能够展现出稳定的人格特质，模仿人类细微的情绪与认知模式，还能辅助各种各样的社会科学仿真实验，为教育心理学、社会心理学、文化心理学、临床心理学、心理咨询等诸多心理学研究领域，提供了新的研究思路。

来自主题: AI技术研报

3828 点击 2024-03-13 11:15

350亿参数、开放权重，Transformer作者创业后推出新大模型

350亿参数、开放权重，Transformer作者创业后推出新大模型

350亿参数、开放权重，Transformer作者创业后推出新大模型

开源大语言模型宇宙又来了一个强劲对手。Transformer 作者参与创立的 Cohere 公司推出的大模型 Command-R 在可扩展、RAG和工具使用三个方面具有显著的优势。

来自主题: AI技术研报

5938 点击 2024-03-12 18:54

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

当prompt策略遇上分治算法，南加大、微软让大模型炼成「火眼金睛」

近年来，大语言模型（LLMs）由于其通用的问题处理能力而引起了大量的关注。现有研究表明，适当的提示设计（prompt enginerring），例如思维链（Chain-of-Thoughts），可以解锁 LLM 在不同领域的强大能力。

来自主题: AI资讯

5486 点击 2024-03-11 17:28

上一页当前第74页,共88页下一页