AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

还在手动在不同工具间来回切换查文献、跑代码、看结果?两个月前发起内侧的科研龙虾SciClaw,经过上万名科研人的「考核」,正式升级为Mira,推出专家小队、科研画布、LLM WIKI 三大核心能力,首次将「Vibe Researching」理念产品化,让研究者像组建实验室团队一样配置 AI,把时间还给真正的科学思考。

来自主题: AI资讯
8766 点击    2026-06-10 11:48
32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

形式化定理证明,一直是LLM公认最严苛的推理试金石,每一步推导都必须通过Lean 4内核的机器验证。

来自主题: AI技术研报
7316 点击    2026-06-09 09:37
ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

近年来,大语言模型能力的提升,已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径:通过多个专家模型的协作来完成生成任务。

来自主题: AI技术研报
9683 点击    2026-06-08 09:47
CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,

来自主题: AI技术研报
8885 点击    2026-06-07 10:54
Claude Cowork做不好的领域,被国产黑马Agent彻底跑通了!

Claude Cowork做不好的领域,被国产黑马Agent彻底跑通了!

Claude Cowork做不好的领域,被国产黑马Agent彻底跑通了!

Cowork 在 Claude 带火后,大厂都在做,企业也早在用。但通用就是通用,碰上房地产这种数据非标、容错为零的硬骨头,全部露怯。跑通这块的,反而是一匹国产黑马。

来自主题: AI资讯
7983 点击    2026-06-03 15:26
图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟,到 VLA、世界模型等开始进入物理世界,AI 正在不断拓宽其能力边界。

来自主题: AI技术研报
6421 点击    2026-06-02 15:05
Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

Speech LLM 的下一个突破口:你的语音大模型可以是个「带韵律的文本模型」

相信大家都有过这样的体验:同一个系列的模型,使用文本交互的时候,模型就像开启了 “最强大脑”,数学代码等各种复杂推理任务样样精通,可是一旦将其改造成语音对话模型之后,性能就猛烈下降,严重 “降智”,经常会犯很多基本的逻辑错误。

来自主题: AI技术研报
5938 点击    2026-05-28 14:51
VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer(Qwen-Image)、混合 AR-DiT(Qwen-Omni)、统一理解 + 生成(BAGEL、HunyuanImage-3.0)等架构。

来自主题: AI技术研报
7486 点击    2026-05-26 10:26
告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

今年以来,在线策略蒸馏 OPD(On-Policy Distillation)已经逐渐成为大厂 LLM 后训练中的重要组件,例如 DeepSeek-V4,GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力,相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报
6972 点击    2026-05-26 10:07
还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」

来自主题: AI技术研报
8608 点击    2026-05-25 10:13