AI资讯新闻榜单内容搜索-大语言模型

AI意识更进一步！谷歌DeepMind等：LLM不仅能感受痛苦，还能趋利避害

以大语言模型为代表的AI在智力方面已经逐渐逼近甚至超过人类，但能否像人类一样有痛苦、快乐这样的感知呢？近日，谷歌团队和LSE发表了一项研究，他们发现，LLM能够做出避免痛苦的权衡选择，这也许是实现「有意识AI」的第一步。

来自主题: AI技术研报

5661 点击 2025-02-14 13:48

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

推理大语言模型（LLM），如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域已超越人类专家，并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习（Reinforcement Learning）和推理规模（Inference scaling）。

来自主题: AI技术研报

5605 点击 2025-02-12 11:33

网传DeepSeek R1更容易被越狱？这有个入选顶会的防御框架SelfDefend

近日，来自香港科技大学、南洋理工大学等机构的研究团队最新成果让这一设想成为现实。他们提出的 SelfDefend 框架，让大语言模型首次拥有了真正意义上的 ' 自卫能力 '，能够有效识别和抵御各类越狱攻击，同时保持极低的响应延迟。

来自主题: AI技术研报

4663 点击 2025-02-11 14:48

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。

来自主题: AI技术研报

5806 点击 2025-02-07 16:16

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型（LMMs）引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens，并将其嵌入大语言模型（LLM）上下文来实现视觉信息理解。

来自主题: AI技术研报

2773 点击 2025-02-06 15:26

垃圾提问+垃圾解读=垃圾文章：用「幻觉长城」来黑DeepSeek，谁给你的胆子？

“垃圾进，垃圾出！”在中文互联网上，一场针对国产AI技术的恶意攻击正在悄然蔓延。某些自媒体以“污染中文互联网”为名，对DeepSeek等国产大语言模型发起了一场看似正义、实则荒谬的讨伐。他们将“幻觉”这一技术术语污名化，试图用莫须有的罪名抹黑国产AI的进步。

来自主题: AI技术研报

7004 点击 2025-02-06 12:28

字节跳动BitsAI-CR：基于LLM的代码审查系统技术揭秘

在人工智能浪潮席卷全球的今天，大语言模型 (LLM) 正在重塑软件开发流程。近日，字节跳动首次对外披露其内部广泛应用的代码审查系统 BitsAI-CR 的技术细节，展示了 AI 在提升企业研发效率方面的重要进展。

来自主题: AI技术研报

6569 点击 2025-02-03 18:01

Fullmoon 可以在完全断网的情况下在苹果手机上使用AI 大语言模型

1月13日Mainframe公司发布了可以离线运行在苹果系统（Mac，iPad，iPhone）的本地大语言模型fullmoon: local intelligence

来自主题: AI资讯

5576 点击 2025-01-30 18:05

推理模型规划任务成功率从5%到95%，DeepMind遗传算法新研究火了

瞄准推理时扩展（Inference-time scaling），DeepMind新的进化搜索策略火了！所提出的“Mind Evolution”（思维进化），能够优化大语言模型（LLMs）在规划和推理中的响应。

来自主题: AI技术研报

8593 点击 2025-01-24 15:05

AI模拟社会的“幕后”操控者是谁？

设想一场高度智能的模拟游戏，游戏的角色不再是普通的NPC，而是由大语言模型驱动的智能体。在这其中，悄然生出一个趣事——在人类的设计下，这些新NPC的言行不经意间变得过于啰嗦。

来自主题: AI技术研报

6371 点击 2025-01-21 10:42