AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长,达400万token! 刚刚,“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报
7529 点击    2025-01-15 15:10
重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

在软件开发过程中,测试用例的生成一直是一个既重要又耗时的环节。近年来,大型语言模型(LLM)在这一领域展现出了巨大的潜力。然而,实践表明,即使是同一个提示词(Prompt),在不同的LLM上也会产生截然不同的效果。

来自主题: AI技术研报
4855 点击    2025-01-13 10:54
企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

随着大语言模型(LLM)技术的快速发展,单一AI智能体已经展现出强大的问题解决能力。然而,在面对复杂的企业级应用场景时,单一智能体的能力往往显得捉襟见肘。

来自主题: AI技术研报
5115 点击    2025-01-09 10:28
「小模型」有更多机会点

「小模型」有更多机会点

「小模型」有更多机会点

大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。

来自主题: AI资讯
6375 点击    2025-01-08 14:50
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据激发高级推理能力!近日,来自清华的研究者提出了PRIME,通过隐式奖励来进行过程强化,提高了语言模型的推理能力,超越了SFT以及蒸馏等方法。

来自主题: AI技术研报
3097 点击    2025-01-08 11:12
DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

在人工智能领域,大语言模型(LLMs)展现出了令人惊叹的能力,但在因果推理这一人类智能的核心能力上仍面临重大挑战。特别是在从相关性信息推断因果关系这一任务上,现有的大语言模型表现出明显的不足。

来自主题: AI技术研报
3319 点击    2025-01-06 13:39
o1 的野路子:用语言模型做动画

o1 的野路子:用语言模型做动画

o1 的野路子:用语言模型做动画

冬天来了,家里下雪了吗?

来自主题: AI技术研报
6648 点击    2025-01-04 16:26
Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

预训练语言模型通常在其参数中编码大量信息,并且随着规模的增加,它们可以更准确地回忆和使用这些信息。

来自主题: AI技术研报
7445 点击    2025-01-04 14:14
Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

Agent 炒作一年仍未落地,99% 不懂 AI 的人和剩下 1 % 产生了鸿沟

万字长文盘点 2024,展望 2025 2024 年,大语言模型(LLM)迎来了翻天覆地的变化。让我们一起回顾过去一年中这个领域的重大发现,梳理其中的关键主题和标志性时刻。

来自主题: AI资讯
7526 点击    2025-01-04 12:24