AI资讯新闻榜单内容搜索-大语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大语言模型

生成与理解相互促进！华科字节提出Liquid，揭示统一多模态模型尺度规律！

生成与理解相互促进！华科字节提出Liquid，揭示统一多模态模型尺度规律！

生成与理解相互促进！华科字节提出Liquid，揭示统一多模态模型尺度规律！

近年来大语言模型（LLM）的迅猛发展正推动人工智能迈向多模态融合的新纪元。然而，现有主流多模态大模型（MLLM）依赖复杂的外部视觉模块（如 CLIP 或扩散模型），导致系统臃肿、扩展受限，成为跨模态智能进化的核心瓶颈。

来自主题: AI技术研报

9418 点击 2025-03-04 09:52

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

大语言模型（LLMs）在当今的自然语言处理领域扮演着越来越重要的角色，但其安全性问题也引发了广泛关注。

来自主题: AI技术研报

6797 点击 2025-03-03 09:53

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

在大语言模型 (LLM) 的研究中，与以 Chain-of-Thought 为代表的逻辑思维能力相比，LLM 中同等重要的 Leap-of-Thought 能力，也称为创造力，目前的讨论和分析仍然较少。这可能会严重阻碍 LLM 在创造力上的发展。造成这种困局的一个主要原因是，面对「创造力」，我们很难构建一个合适且自动化的评估流程。

来自主题: AI技术研报

6873 点击 2025-03-01 22:13

多模态大模型对齐新范式，10个评估维度全面提升，快手&中科院&南大打破瓶颈

多模态大模型对齐新范式，10个评估维度全面提升，快手&中科院&南大打破瓶颈

多模态大模型对齐新范式，10个评估维度全面提升，快手&中科院&南大打破瓶颈

尽管多模态大语言模型（MLLMs）取得了显著的进展，但现有的先进模型仍然缺乏与人类偏好的充分对齐。这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域（例如减少幻觉问题），是否与人类偏好对齐可以全面提升MLLM的各种能力仍是一个未知数。

来自主题: AI技术研报

10323 点击 2025-02-26 14:07

Meta首席AI科学家杨立昆，再次炮轰生成式AI

Meta首席AI科学家杨立昆，再次炮轰生成式AI

Meta首席AI科学家杨立昆，再次炮轰生成式AI

“放弃生成式模型，不研究LLM（大语言模型），我们没办法只通过文本训练让AI达到人类的智慧水平。”近日，Meta首席AI科学家杨立昆（Yann LeCun）在法国巴黎的2025年人工智能行动峰会上再一次炮轰了生成式AI。

来自主题: AI资讯

8141 点击 2025-02-24 08:41

斯坦福最新AI Agent序列化证伪假设检验自动化框架，向卡尔·波普尔致敬

斯坦福最新AI Agent序列化证伪假设检验自动化框架，向卡尔·波普尔致敬

斯坦福最新AI Agent序列化证伪假设检验自动化框架，向卡尔·波普尔致敬

在人工智能高速发展的今天，我们似乎迎来了一个"假设爆炸"的时代。大语言模型每天都在产生数以万计的研究假设，它们看似合理，却往往难以验证。这让我不禁想起了20世纪最具影响力的科学哲学家之一——卡尔·波普尔。

来自主题: AI技术研报

8867 点击 2025-02-23 11:13

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中，预训练 + 微调范式已经成为了部署各类下游应用的重要基础。在该框架下，通过使用搭低秩自适应（LoRA）方法的大模型参数高效微调（PEFT）技术，已经产生了大量针对特定任务、可重用的 LoRA 适配器。

来自主题: AI技术研报

7726 点击 2025-02-22 13:57

2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台

2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台

2024-arXiv-FinRobot: 一种基于大语言模型的开源金融应用 AI 智能体平台

随着金融机构和专业人士越来越多地将大语言模型（LLMs）纳入其工作流程中，金融领域与人工智能社区之间依然存在显著障碍，包括专有数据和专业知识的壁垒。本文提出了 FinRobot，一种支持多个金融专业化人工智能智能体的新型开源 AI 智能体平台，每个代理均由 LLM 提供动力。

来自主题: AI技术研报

8391 点击 2025-02-20 11:33

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI 等提出的新基准再次暴露了大语言模型的弱点。

来自主题: AI技术研报

9835 点击 2025-02-17 14:49

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

近年来，大语言模型（LLMs）取得了突破性进展，展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前，普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报

8151 点击 2025-02-17 14:37

上一页当前第25页,共56页下一页