AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景,一个隐秘却致命的瓶颈正在浮现:Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板,我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解?

来自主题: AI技术研报
8120 点击    2026-06-04 16:38
规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

为解决科研中对单篇文献深度解析的需求,佐治亚大学团队提出IntrAgent,专注单篇内容,避免大模型幻觉。通过段落排序与迭代阅读机制,精准提取实验细节与元数据。

来自主题: AI技术研报
10087 点击    2026-06-04 16:38
吃透大模型SFT底层机理:终结实践争议,规避无效算力

吃透大模型SFT底层机理:终结实践争议,规避无效算力

吃透大模型SFT底层机理:终结实践争议,规避无效算力

长期以来,监督微调(Supervised Fine-Tuning,SFT)一直是深度神经网络中最常用的模型适配手段。在中小规模的传统神经网络中,SFT 通常能够稳定提升下游任务表现。

来自主题: AI技术研报
6270 点击    2026-06-04 08:38
多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读

多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读

多模态模型终于不用「抽帧看世界」?LLaVA-OneVision-2.0全开源全帧率技术解读

由格灵深瞳灵感实验室主导研发的 LLaVA-OneVision-2.0,是一款面向下一代感知智能的视觉语言大模型。团队充分利用视频 Codec 流和自研 OneVision-Encoder,实现跨帧、跨事件的增量观测和连续证据流建模。本文将详细介绍模型架构、训练方法与能力验证,展示该技术在视频理解、空间推理和目标追踪等任务中的应用潜力。

来自主题: AI技术研报
6023 点击    2026-06-03 15:03
大模型「行口」不一?首个专测执行幻觉基准,覆盖真实行为越狱

大模型「行口」不一?首个专测执行幻觉基准,覆盖真实行为越狱

大模型「行口」不一?首个专测执行幻觉基准,覆盖真实行为越狱

随着大模型智能体深入渗透真实操作系统,一种全新的安全威胁悄然成型:行为越狱(Behavior Jailbreak)。现有安全基准只盯着模型「说了什么」,却对「做了什么」视而不见。新基准LITMUS是首个同时覆盖真实OS环境行为越狱、语义-物理双层验证与多攻击范式的完整评测体系,并首次系统量化了「执行幻觉」这一被整个评测社区忽视的致命盲区。

来自主题: AI技术研报
9612 点击    2026-06-03 14:33
Windows 完成 AI 底层重构:MXC 沙盒 + 自研七大AI模型 + 长效自主 Agent 齐登场

Windows 完成 AI 底层重构:MXC 沙盒 + 自研七大AI模型 + 长效自主 Agent 齐登场

Windows 完成 AI 底层重构:MXC 沙盒 + 自研七大AI模型 + 长效自主 Agent 齐登场

Windows 从传统 PC 操作系统转型为原生 Agent 智能体运行系统,围绕系统安全底座、Copilot 一体化超级 AI、7 款自研全栈大模型、本地端侧 AI 硬件、新型智能硬件五大板块落地 AI 新功能

来自主题: AI资讯
10051 点击    2026-06-03 10:33
加速建设中国大模型高质量数据基础设施,「智能知识」完成天使轮融资

加速建设中国大模型高质量数据基础设施,「智能知识」完成天使轮融资

加速建设中国大模型高质量数据基础设施,「智能知识」完成天使轮融资

近日,「智能知识」(Human Intelligence)完成天使轮融资,由耀途资本、锦秋基金联合投资。本轮融资资金将用于两个方向:前沿数据品类扩张:深耕 Coding、Enterprise Office(GDPVal)、Agentic Tool Use 等高价值数据,并积极探索 AI4Math、AI4Science、AutoResearch 等新场景;

来自主题: AI资讯
9087 点击    2026-06-03 09:50
字节AI大牛顾全全宣布离职,或投身AI4S创业

字节AI大牛顾全全宣布离职,或投身AI4S创业

字节AI大牛顾全全宣布离职,或投身AI4S创业

刚刚,顾全全发文告别字节 Seed 团队。在此之前,他是 Seed 旗下聚焦科学智能领域的 AI4S 团队核心成员。顾全全是机器学习理论、大模型对齐以及 AI4S 科学智能领域知名的学者。他于 2007 年和 2010 年分获清华大学自动化专业学士、控制科学与工程硕士学位,2014 年获伊利诺伊大学香槟分校计算机科学博士学位,随后在普林斯顿大学运筹与金融工程系(ORFE)开展统计学博士后研究。

来自主题: AI资讯
7985 点击    2026-06-02 16:18
Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

Mind Lab连续发布LoRA最新进展,大模型「持续学习」新范式浮现

最近,前沿实验室 Mind Lab 密集发布了一系列关于 LoRA 与 PEFT(高效微调)的研究结果,似乎描绘出了另一条大模型「持续学习」的路径。在 Mind Lab 的视角中,PEFT 不再是对大模型全参数后训练的一种廉价平替,更是实现从 “基础模型” 向 “可持续学习智能体” 过渡的核心架构机制。

来自主题: AI技术研报
8356 点击    2026-06-02 12:25