AI资讯新闻榜单内容搜索-上下文

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 上下文

微软首个多模态Phi-4问世，56亿参数秒杀GPT-4o！LoRA华人大佬带队

微软首个多模态Phi-4问世，56亿参数秒杀GPT-4o！LoRA华人大佬带队

微软首个多模态Phi-4问世，56亿参数秒杀GPT-4o！LoRA华人大佬带队

Phi-4系列模型上新了！56亿参数Phi-4-multimodal集语音、视觉、文本多模态于一体，读图推理性能碾压GPT-4o；另一款38亿参数Phi-4-mini在推理、数学、编程等任务中超越了参数更大的LLM，支持128K token上下文。

来自主题: AI技术研报

6425 点击 2025-02-28 14:11

AI助手集体免费，微软OpenAI谷歌火力全开！Gemini 18万次代码补全白送

AI助手集体免费，微软OpenAI谷歌火力全开！Gemini 18万次代码补全白送

AI助手集体免费，微软OpenAI谷歌火力全开！Gemini 18万次代码补全白送

谷歌Gemini 2.0代码助手免费，每月18万次代码补全，支持超大上下文窗口。微软Copilot语音与深度思考功能，同样免费！OpenAI也免费推出了GPT-4o mini高级语音模式。

来自主题: AI资讯

8294 点击 2025-02-27 16:42

大模型「记忆断片」成历史！AI初创全新Zep系统，知识图谱破解上下文诅咒

大模型「记忆断片」成历史！AI初创全新Zep系统，知识图谱破解上下文诅咒

大模型「记忆断片」成历史！AI初创全新Zep系统，知识图谱破解上下文诅咒

Zep，一个为大模型智能体提供长期记忆的插件，能将智能体的记忆组织成情节，从这些情节中提取实体及其关系，并将它们存储在知识图谱中，从而让用户以低代码的方式为智能力构建长期记忆。

来自主题: AI技术研报

10383 点击 2025-02-26 14:53

月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

月之暗面Kimi的技术一点都不落后。

2 月 18 日，月之暗面发布了一篇关于稀疏注意力框架 MoBA 的论文。MoBA 框架借鉴了 Mixture of Experts（MoE）的理念，提升了处理长文本的效率，它的上下文长度可扩展至 10M。并且，MoBA 支持在全注意力和稀疏注意力之间无缝切换，使得与现有的预训练模型兼容性大幅提升。

来自主题: AI技术研报

9069 点击 2025-02-23 11:38

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。

来自主题: AI技术研报

6724 点击 2025-02-20 14:25

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

近年来，大语言模型（LLMs）取得了突破性进展，展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。目前，普遍的观点认为其成功依赖于自回归模型的「next token prediction」范式。

来自主题: AI技术研报

8617 点击 2025-02-17 14:37

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘：DeepSeek-R1-Zero或许并不存在「顿悟时刻」

一项非常鼓舞人心的发现是：DeepSeek-R1-Zero 通过纯强化学习（RL）实现了「顿悟」。在那个瞬间，模型学会了自我反思等涌现技能，帮助它进行上下文搜索，从而解决复杂的推理问题。

来自主题: AI技术研报

8759 点击 2025-02-07 15:51

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型（LMMs）引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens，并将其嵌入大语言模型（LLM）上下文来实现视觉信息理解。

来自主题: AI技术研报

4106 点击 2025-02-06 15:26

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

Qwen开源首个长文本新模型，百万Tokens处理性能超GPT-4o-mini

谈到大模型的“国货之光”，除了DeepSeek之外，阿里云Qwen这边也有新动作——首次将开源Qwen模型的上下文扩展到1M长度。

来自主题: AI资讯

8970 点击 2025-01-27 14:18

六大维度，LLM「问题生成」首次正面PK人类！伯克利等发布最新研究

六大维度，LLM「问题生成」首次正面PK人类！伯克利等发布最新研究

六大维度，LLM「问题生成」首次正面PK人类！伯克利等发布最新研究

研究人员首次探讨了大型语言模型（LLMs）在问题生成任务中的表现，与人类生成的问题进行了多维度对比，结果发现LLMs倾向于生成需要较长描述性答案的问题，且在问题生成中对上下文的关注更均衡。

来自主题: AI技术研报

7719 点击 2025-01-27 13:26

上一页当前第20页,共33页下一页