AI资讯新闻榜单内容搜索-大语言模型

垃圾提问+垃圾解读=垃圾文章：用「幻觉长城」来黑DeepSeek，谁给你的胆子？

“垃圾进，垃圾出！”在中文互联网上，一场针对国产AI技术的恶意攻击正在悄然蔓延。某些自媒体以“污染中文互联网”为名，对DeepSeek等国产大语言模型发起了一场看似正义、实则荒谬的讨伐。他们将“幻觉”这一技术术语污名化，试图用莫须有的罪名抹黑国产AI的进步。

来自主题: AI技术研报

8930 点击 2025-02-06 12:28

在人工智能浪潮席卷全球的今天，大语言模型 (LLM) 正在重塑软件开发流程。近日，字节跳动首次对外披露其内部广泛应用的代码审查系统 BitsAI-CR 的技术细节，展示了 AI 在提升企业研发效率方面的重要进展。

来自主题: AI技术研报

8253 点击 2025-02-03 18:01

1月13日Mainframe公司发布了可以离线运行在苹果系统（Mac，iPad，iPhone）的本地大语言模型fullmoon: local intelligence

来自主题: AI资讯

8342 点击 2025-01-30 18:05

瞄准推理时扩展（Inference-time scaling），DeepMind新的进化搜索策略火了！所提出的“Mind Evolution”（思维进化），能够优化大语言模型（LLMs）在规划和推理中的响应。

来自主题: AI技术研报

10001 点击 2025-01-24 15:05

设想一场高度智能的模拟游戏，游戏的角色不再是普通的NPC，而是由大语言模型驱动的智能体。在这其中，悄然生出一个趣事——在人类的设计下，这些新NPC的言行不经意间变得过于啰嗦。

来自主题: AI技术研报

8622 点击 2025-01-21 10:42

李继刚在消失半年后，带着汉语新解重新归来，一出手大家就惊呼李继刚的prompt已经到了next level。但不懂编程的小白又懵逼了！怎么提示词也开始编程了？大语言模型的优势不是通过说话就能达成需求吗？怎么又开始需要编程了？技术在倒退吗？

来自主题: AI技术研报

8669 点击 2025-01-21 10:25

在当今AI技术迅猛发展的背景下，大语言模型（LLM）的评估问题已成为一个不可忽视的挑战。传统的做法是直接采用最强大的模型（如GPT-4）进行评估，这就像让最高法院的大法官直接处理所有交通违章案件一样，既不经济也不一定总能保证公正。

来自主题: AI技术研报

7356 点击 2025-01-20 10:50

随着当前大语言模型的广泛应用和推理时扩展的新范式的崛起，如何实现高效的大规模推理成为了一个巨大挑战。特别是在语言模型的推理阶段，传统注意力机制中的键值缓存（KV Cache）会随着批处理大小和序列长度线性增长，俨然成为制约大语言模型规模化应用和推理时扩展的「内存杀手」。

来自主题: AI技术研报

8388 点击 2025-01-18 09:57

在多模态大语言模型（MLLMs）的发展中，视觉 - 语言连接器作为将视觉特征映射到 LLM 语言空间的关键组件，起到了桥梁作用。

来自主题: AI技术研报

8451 点击 2025-01-12 10:22

随着大语言模型（LLM）技术的快速发展，单一AI智能体已经展现出强大的问题解决能力。然而，在面对复杂的企业级应用场景时，单一智能体的能力往往显得捉襟见肘。

来自主题: AI技术研报

7527 点击 2025-01-09 10:28