AI资讯新闻榜单内容搜索-LLM

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LLM
一夜反转!「杀进第一梯队」的巴西LLM竟「套壳缝合」了国产模型

一夜反转!「杀进第一梯队」的巴西LLM竟「套壳缝合」了国产模型

一夜反转!「杀进第一梯队」的巴西LLM竟「套壳缝合」了国产模型

昨天,AI 圈大都被这一新闻「刷屏」:巴西里约热内卢市政府旗下的一家 IT 公司,平地一声雷地推出一款名为「Rio 3.5」397B 的开源模型,甚至还一路逆袭杀进了全球第一梯队,超越 Qwen 3.7 Plus 等开源模型,在多项基准测试中斩获 SOTA 性能。

来自主题: AI技术研报
6383 点击    2026-06-15 14:50
BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时,Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文,并支撑跨时间的推理能力。

来自主题: AI技术研报
8136 点击    2026-06-15 09:20
Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

近日,Anthropic 发布了一篇引发广泛关注的文章《When AI builds itself》。文中披露了极其惊人的内部数据:截至 2026 年 5 月,Anthropic 超过 80% 的合并代码已由 Claude 编写,工程师的日常代码产出飙升了 8 倍;更令人瞩目的是,AI 智能体已经可以自主提出假设、执行长达数百小时的强化安全实验。

来自主题: AI技术研报
10095 点击    2026-06-12 10:13
我做了个测试 Claude API 中转站的 Skill,测完发现水太深了

我做了个测试 Claude API 中转站的 Skill,测完发现水太深了

我做了个测试 Claude API 中转站的 Skill,测完发现水太深了

根据我长期使用的观察,0.3 倍率说是用 Kiro 逆向出来的 Claude,2.0 倍率说是正经 Claude Max 号池接出来的。听起来后者肯定更靠谱。我一开始也这么想的。毕竟倍率差了快七倍,价格摆在那,总不至于拿假货糊弄人吧。

来自主题: AI资讯
9256 点击    2026-06-11 16:53
刚刚,Anthropic道歉了

刚刚,Anthropic道歉了

刚刚,Anthropic道歉了

压力之下,刚刚,《连线》记者 Max Zeff 爆料称,Anthropic 正在撤销这一政策。该媒体从 Anthropic 获得了一份声明,其中写到:「我们正在调整 Fable 5 针对前沿 LLM 开发的安全限制,使其变得可见。」

来自主题: AI资讯
9116 点击    2026-06-11 15:02
斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

分布式系统的 “圣杯”—— 共识协议(Consensus Protocols),长久以来都是顶级基础设施工程师的 “Bug 地狱”。由于其状态极其复杂、多节点交织,传统测试和单体 LLM 对硬核的 Deep Bug(深层逻辑漏洞)几乎束手无策。

来自主题: AI技术研报
7757 点击    2026-06-11 14:59
一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

LLM Agent 做长任务时,真正让人头疼的往往不是模型不会推理,而是上下文开始失控:前几步还很清楚,后面就忘约束、丢状态、重复试错,最后把任务跑成事故现场。

来自主题: AI技术研报
6620 点击    2026-06-11 14:32
万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

万人内测,科研神器Mira爆火!4h肝出论文初稿,全自动接管科研

还在手动在不同工具间来回切换查文献、跑代码、看结果?两个月前发起内侧的科研龙虾SciClaw,经过上万名科研人的「考核」,正式升级为Mira,推出专家小队、科研画布、LLM WIKI 三大核心能力,首次将「Vibe Researching」理念产品化,让研究者像组建实验室团队一样配置 AI,把时间还给真正的科学思考。

来自主题: AI资讯
9063 点击    2026-06-10 11:48
32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

形式化定理证明,一直是LLM公认最严苛的推理试金石,每一步推导都必须通过Lean 4内核的机器验证。

来自主题: AI技术研报
7463 点击    2026-06-09 09:37
ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

近年来,大语言模型能力的提升,已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径:通过多个专家模型的协作来完成生成任务。

来自主题: AI技术研报
9817 点击    2026-06-08 09:47