AI资讯新闻榜单内容搜索-CoT

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: CoT

多模态后训练反常识：长思维链SFT和RL的协同困境

多模态后训练反常识：长思维链SFT和RL的协同困境

多模态后训练反常识：长思维链SFT和RL的协同困境

在语言模型领域，长思维链监督微调（Long-CoT SFT）与强化学习（RL）的组合堪称黄金搭档 —— 先让模型学习思考模式，再用奖励机制优化输出，性能通常能实现叠加提升。

来自主题: AI技术研报

5979 点击 2025-08-02 12:49

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

ICML 2025 | CoTo：让LoRA训练「渐入佳境」，模型融合、剪枝样样精通

还在为 LoRA 训练不稳定、模型融合效果差、剪枝后性能大降而烦恼吗？来自香港城市大学、南方科技大学、浙江大学等机构的研究者们提出了一种简单的渐进式训练策略，CoTo，通过在训练早期随机失活一部分适配器，并逐渐提高其激活概率，有效缓解了层级不均衡问题，并显著增强了模型在多任务融合和剪枝等操作上的鲁棒性和有效性。该工作已被机器学习顶会 ICML 2025 接收。

来自主题: AI技术研报

5396 点击 2025-07-27 13:12

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗？

大语言模型（Large Language Model, LLM）在复杂推理任务中表现卓越。借助链式思维（Chain-of-Thought, CoT），LLM 能够将复杂问题分解为简单步骤，充分探索解题思路并得出正确答案。LLM 已在多个基准上展现出优异的推理能力，尤其是数学推理和代码生成。

来自主题: AI技术研报

4905 点击 2025-07-24 15:10

超越O4-mini，多模态大模型终于学会回头「看」：中科院自动化所提出GThinker模型

超越O4-mini，多模态大模型终于学会回头「看」：中科院自动化所提出GThinker模型

超越O4-mini，多模态大模型终于学会回头「看」：中科院自动化所提出GThinker模型

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。

来自主题: AI技术研报

5533 点击 2025-07-20 11:50

OpenAI谷歌Anthropic罕见联手发研究！Ilya/Hinton/Bengio带头支持，共推CoT监测方案

OpenAI谷歌Anthropic罕见联手发研究！Ilya/Hinton/Bengio带头支持，共推CoT监测方案

OpenAI谷歌Anthropic罕见联手发研究！Ilya/Hinton/Bengio带头支持，共推CoT监测方案

难得难得，几大AI巨头不竞争了不抢人了，改联合一起发研究了。

来自主题: AI技术研报

5869 点击 2025-07-16 15:48

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

大模型在潜空间中推理，带宽能达到普通（显式）思维链（CoT）的2700多倍？

来自主题: AI技术研报

7312 点击 2025-07-16 15:26

为什么你用AI编程总拿不到想要的结果？北航研究揭秘：50%问题来自CoT和你自己

为什么你用AI编程总拿不到想要的结果？北航研究揭秘：50%问题来自CoT和你自己

为什么你用AI编程总拿不到想要的结果？北航研究揭秘：50%问题来自CoT和你自己

现在几乎所有主流的代码生成工具都在用CoT。但问题来了：这些"思考步骤"真的可靠吗？来自北京航空航天大学的研究者们发现，虽然CoT提升了性能，但关于这些中间推理步骤的质量，学术界竟然没有系统性的研究！

来自主题: AI技术研报

6002 点击 2025-07-16 10:13

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

原来，CoT推理竟是假象！Bengio带队最新论文戳穿了CoT神话——我们所看到的推理步骤，并非是真实的。不仅如此，LLM在推理时会悄然纠正错误，却在CoT中只字未提。

来自主题: AI技术研报

8199 点击 2025-07-03 11:09

阿里通义开源首个CoT音频模型，音·画同步被狠狠拿捏了

阿里通义开源首个CoT音频模型，音·画同步被狠狠拿捏了

阿里通义开源首个CoT音频模型，音·画同步被狠狠拿捏了

AI音效已经进化成这样了吗？？

来自主题: AI技术研报

6944 点击 2025-07-01 15:56

只用2700万参数，这个推理模型超越了DeepSeek和Claude

只用2700万参数，这个推理模型超越了DeepSeek和Claude

只用2700万参数，这个推理模型超越了DeepSeek和Claude

像人一样推理。大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

来自主题: AI技术研报

6065 点击 2025-07-01 10:26

上一页当前第1页,共9页下一页