AI资讯新闻榜单内容搜索-语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 语言模型

AI时代，作者已死？

AI时代，作者已死？

AI时代，作者已死？

对于任何书面文件，比如此刻你正阅读的这篇文章，追问它出自谁手，似乎理所当然。为此，你可能会八卦一番作者履历，了解作者的一些背景，因作者身份能助你辨认他所写内容的权威性。譬如，对于此文，如果我的履历显示我任职于美国的一所大学的传播学教授，你可能会据此认定我谈论大语言模型相关的颠覆性事件是恰如其分的，甚至因此信任我的观点。毕竟，你已确认了“作者”的身份并发现他在此领域颇有建树。

来自主题: AI技术研报

6422 点击 2025-07-30 10:45

ICML25|标点符号竟是LLM记忆核心！正确处理性能暴涨

ICML25|标点符号竟是LLM记忆核心！正确处理性能暴涨

ICML25|标点符号竟是LLM记忆核心！正确处理性能暴涨

近年来，大语言模型（LLM）的能力越来越强，但它们的“饭量”也越来越大。这个“饭量”主要体现在计算和内存上。当模型处理的文本越来越长时，一个叫做“自注意力（Self-Attention）”的核心机制会导致计算量呈平方级增长。这就像一个房间里的人开会，如果每个人都要和在场的其他所有人单独聊一遍，那么随着人数增加，总的对话次数会爆炸式增长。

来自主题: AI技术研报

5862 点击 2025-07-29 12:29

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

ACL 2025｜驱动LLM强大的过程级奖励模型（PRMs）正遭遇「信任危机」？

近年来，大型语言模型（LLMs）在复杂推理任务中展现出惊人的能力，这在很大程度上得益于过程级奖励模型（PRMs）的赋能。PRMs 作为 LLMs 进行多步推理和决策的关键「幕后功臣」，负责评估推理过程的每一步，以引导模型的学习方向。

来自主题: AI技术研报

6520 点击 2025-07-28 10:49

千脑智能觉醒：感知-运动智能模型，亿倍优于视觉Transformer？

千脑智能觉醒：感知-运动智能模型，亿倍优于视觉Transformer？

千脑智能觉醒：感知-运动智能模型，亿倍优于视觉Transformer？

在大语言模型席卷全球的时代，坚持更接近生命本质的智能是少有人走的路。2025年7月初，一篇来自Numenta与Thousand Brains Project的论文，首次通过一个名为“Monty”的AI系统，实验性地验证了神经科学家杰夫·霍金斯（Jeff Hawkins）提出的“千脑智能理论”。

来自主题: AI资讯

6103 点击 2025-07-27 13:46

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

当前最强大的大语言模型（LLM）虽然代码能力飞速发展，但在解决真实、复杂的机器学习工程（MLE）任务时，仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码，却无法模拟人类工程师那样，在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。

来自主题: AI技术研报

6515 点击 2025-07-27 12:43

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

7931 点击 2025-07-25 09:51

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

五倍推理加速，激发自回归潜能，苹果新工作让LLM预测未来

近年来，语言模型的显著进展主要得益于大规模文本数据的可获得性以及自回归训练方法的有效性。

来自主题: AI技术研报

7504 点击 2025-07-24 15:28

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力，尤其是数学推理和代码生成。

来自主题: AI技术研报

5354 点击 2025-07-24 15:10

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

扩散语言模型（Diffusion-based LLMs，简称 dLLMs）以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性，成为一个重要的发展方向。

来自主题: AI技术研报

8031 点击 2025-07-23 15:04

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025｜清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

大语言模型（Large Language Models，LLMs）技术的迅猛发展，正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力，能够快速读取医学文献、解读病历记录，甚至基于患者表述生成初步诊断建议，有效辅助医生提升诊断的准确性与效率。

来自主题: AI技术研报

6075 点击 2025-07-23 13:25

上一页当前第11页,共87页下一页