AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

随着 OpenAI o1 和 DeepSeek R1 的爆火，大语言模型（LLM）的推理能力增强和测试时扩展（TTS）受到广泛关注。然而，在复杂推理问题中，如何精准评估模型每一步回答的质量，仍然是一个亟待解决的难题。传统的过程奖励模型（PRM）虽能验证推理步骤，但受限于标量评分机制，难以捕捉深层逻辑错误，且其判别式建模方式限制了测试时的拓展能力。

来自主题: AI技术研报

8151 点击 2025-04-14 14:39

中科大、中兴提出新后训练范式：小尺寸多模态模型，成功复现R1推理

中科大、中兴提出新后训练范式：小尺寸多模态模型，成功复现R1推理

中科大、中兴提出新后训练范式：小尺寸多模态模型，成功复现R1推理

近年来，随着大型语言模型（LLMs）的快速发展，多模态理解领域取得了前所未有的进步。像 OpenAI、InternVL 和 Qwen-VL 系列这样的最先进的视觉-语言模型（VLMs），在处理复杂的视觉-文本任务时展现了卓越的能力。

来自主题: AI技术研报

4857 点击 2025-04-14 13:57

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

谢赛宁等新作上线，多模态理解生成大一统！思路竟与GPT-4o相似？

来自Meta和NYU的团队，刚刚提出了一种MetaQuery新方法，让多模态模型瞬间解锁多模态生成能力！令人惊讶的是，这种方法竟然如此简单，就实现了曾被认为需要MLLM微调才能具备的能力。

来自主题: AI技术研报

7235 点击 2025-04-13 14:11

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用，而以ChatGPT、GPT-4等为代表的通用大语言模型（LLM）虽然能够生成流畅文本，但经常出现“引用幻觉”（Citation Hallucination），即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。

来自主题: AI技术研报

8520 点击 2025-04-11 10:20

首个统一多模态模型评测标准，DeepSeek Janus理解能力领跑开源，但和闭源还有差距

首个统一多模态模型评测标准，DeepSeek Janus理解能力领跑开源，但和闭源还有差距

首个统一多模态模型评测标准，DeepSeek Janus理解能力领跑开源，但和闭源还有差距

统一多模态大模型（U-MLLMs）逐渐成为研究热点，近期GPT-4o，Gemini-2.0-flash都展现出了非凡的理解和生成能力，而且还能实现跨模态输入输出，比如图像+文本输入，生成图像或文本。

来自主题: AI技术研报

8010 点击 2025-04-10 10:20

用 Agent 重塑生产力！揭秘扣子的史诗级三大更新，还有三个彩蛋！

用 Agent 重塑生产力！揭秘扣子的史诗级三大更新，还有三个彩蛋！

用 Agent 重塑生产力！揭秘扣子的史诗级三大更新，还有三个彩蛋！

LLM Agent 火了两年了，但业界仍然存在许多非共识。智能体数量卷上去了，概念炒上去了，但质量参差不齐，娱乐向的不好玩，提效向的不好用，具体企业落地更是各种大小问题不断。

来自主题: AI资讯

5810 点击 2025-04-10 09:41

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方：

来自主题: AI资讯

6807 点击 2025-04-09 11:34

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

刚刚，一位AI公司CEO细细扒皮了关于Llama 4的五大疑点。甚至有圈内人表示，Llama 4证明Scaling已经结束了，LLM并不能可靠推理。但更可怕的事，就是全球的AI进步恐将彻底停滞。

来自主题: AI技术研报

8083 点击 2025-04-09 09:49

拿20年前的苹果“古董”笔记本跑模型推理：九分之一现代CPU速度，但成功了

拿20年前的苹果“古董”笔记本跑模型推理：九分之一现代CPU速度，但成功了

拿20年前的苹果“古董”笔记本跑模型推理：九分之一现代CPU速度，但成功了

众所周知，大语言模型（LLM）往往对硬件要求很高。

来自主题: AI资讯

3735 点击 2025-04-09 08:51

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

三个LLM顶一个OpenAI？2亿条性能记录加持，路由n个「小」模型逆袭

路由LLM是指一种通过router动态分配请求到若干候选LLM的机制。论文提出且开源了针对router设计的全面RouterEval基准，通过整合8500+个LLM在12个主流Benchmark上的2亿条性能记录。将大模型路由问题转化为标准的分类任务，使研究者可在单卡甚至笔记本电脑上开展前沿研究。

来自主题: AI技术研报

5727 点击 2025-04-08 14:26

上一页当前第38页,共131页下一页