AI资讯新闻榜单内容搜索-大型语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大型语言模型
深度|Salesforce CEO:Agent正是开启 “无限劳动力” 时代的起点

深度|Salesforce CEO:Agent正是开启 “无限劳动力” 时代的起点

深度|Salesforce CEO:Agent正是开启 “无限劳动力” 时代的起点

OpenAI与微软的关系出现严重裂痕,主要原因是微软开始开发自己的大型语言模型,并聘请了Mustafa Suleyman,并且OpenAI首次使用非微软的数据中心。

来自主题: AI资讯
6053 点击    2025-02-23 10:55
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。

来自主题: AI技术研报
5748 点击    2025-02-07 16:53
六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究

研究人员首次探讨了大型语言模型(LLMs)在问题生成任务中的表现,与人类生成的问题进行了多维度对比,结果发现LLMs倾向于生成需要较长描述性答案的问题,且在问题生成中对上下文的关注更均衡。

来自主题: AI技术研报
6884 点击    2025-01-27 13:26
「完美的搜索引擎」是否存在?这家公司向谷歌发起挑战

「完美的搜索引擎」是否存在?这家公司向谷歌发起挑战

「完美的搜索引擎」是否存在?这家公司向谷歌发起挑战

大型语言模型(LLMs)能够解决研究生水平的数学问题,但今天的搜索引擎却无法准确理解一个简单的三词短语。

来自主题: AI资讯
6393 点击    2025-01-18 15:04
微软最新复杂推理:基于过程奖励的LE-MCTS集成新方法

微软最新复杂推理:基于过程奖励的LE-MCTS集成新方法

微软最新复杂推理:基于过程奖励的LE-MCTS集成新方法

在人工智能快速发展的今天,大型语言模型(LLM)在各类任务中展现出惊人的能力。然而,当面对需要复杂推理的任务时,即使是最先进的开源模型也往往难以保持稳定的表现。现有的模型集成方法,无论是在词元层面还是输出层面的集成,都未能有效解决这一挑战。

来自主题: AI技术研报
5082 点击    2025-01-17 10:36
重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

在软件开发过程中,测试用例的生成一直是一个既重要又耗时的环节。近年来,大型语言模型(LLM)在这一领域展现出了巨大的潜力。然而,实践表明,即使是同一个提示词(Prompt),在不同的LLM上也会产生截然不同的效果。

来自主题: AI技术研报
4392 点击    2025-01-13 10:54
联手OpenAI,吴恩达推出一门o1推理新课程,还免费

联手OpenAI,吴恩达推出一门o1推理新课程,还免费

联手OpenAI,吴恩达推出一门o1推理新课程,还免费

在刚刚过去的 2024 年,OpenAI 推出了 o 系列模型。相比于以往大型语言模型,o 系列模型使用更多的计算进行更深入的「思考」,能够回答更复杂、更细致的问题。

来自主题: AI资讯
7809 点击    2025-01-02 14:53
小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

小身板大能量:树莓派玩转 Phi-2、Mistral 和 LLaVA 等AI大模型~

你是否想过在自己的设备上运行自己的大型语言模型(LLMs)或视觉语言模型(VLMs)?你可能有过这样的想法,但是一想到要从头开始设置、管理环境、下载正确的模型权重,以及你的设备是否能处理这些模型的不确定性,你可能就犹豫了。

来自主题: AI技术研报
7430 点击    2024-12-30 16:53
CMU把具身智能的机器人给越狱了

CMU把具身智能的机器人给越狱了

CMU把具身智能的机器人给越狱了

很多研究已表明,像 ChatGPT 这样的大型语言模型(LLM)容易受到越狱攻击。很多教程告诉我们,一些特殊的 Prompt 可以欺骗 LLM 生成一些规则内不允许的内容,甚至是有害内容(例如 bomb 制造说明)。这种方法被称为「大模型越狱」。

来自主题: AI资讯
7225 点击    2024-12-19 15:56