AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
真钱买假模型?187篇论文被「套壳API」坑惨,准确率暴跌

真钱买假模型?187篇论文被「套壳API」坑惨,准确率暴跌

真钱买假模型?187篇论文被「套壳API」坑惨,准确率暴跌

现在,一篇来自 CISPA 亥姆霍兹信息安全中心的最新论文《Real Money, Fake Models: Deceptive Model Claims in Shadow APIs》为我们揭开了一点谜底:那些你花真金白银购买的「第三方 API」,有可能偷偷把前沿大模型换成了廉价的替代品。

来自主题: AI技术研报
8630 点击    2026-03-07 11:11
小米版OpenClaw来了!手机就能养龙虾,罗福莉成果落地

小米版OpenClaw来了!手机就能养龙虾,罗福莉成果落地

小米版OpenClaw来了!手机就能养龙虾,罗福莉成果落地

今日,小米正式启动类OpenClaw的移动端系统级智能体Xiaomi miclaw小范围封闭测试。最近一段时间,开源项目OpenClaw在开发者社区迅速走红,它展示了大模型调用工具、操作软件完成任务的惊艳能力。在开发者圈里,用OpenClaw搭建智能体助手也被戏称为“养龙虾”。而小米这次发布的Xiaomi miclaw,则把类似思路带进了手机系统。

来自主题: AI资讯
9073 点击    2026-03-06 15:41
模型砍掉一大半,准确率反升15%!华科&阿里安全新研究实现ViT近乎无损的类特定压缩|ICLR'26

模型砍掉一大半,准确率反升15%!华科&阿里安全新研究实现ViT近乎无损的类特定压缩|ICLR'26

模型砍掉一大半,准确率反升15%!华科&阿里安全新研究实现ViT近乎无损的类特定压缩|ICLR'26

近年来,视觉大模型在自动驾驶、智慧医疗等场景中得到广泛应用,但在真实业务环境中,“大而全”的通用模型往往并不是最优选择。

来自主题: AI技术研报
5625 点击    2026-03-06 09:32
林俊旸提出离职后,阿里高管紧急答疑 — 林俊旸离职内幕

林俊旸提出离职后,阿里高管紧急答疑 — 林俊旸离职内幕

林俊旸提出离职后,阿里高管紧急答疑 — 林俊旸离职内幕

北京时间3月4日下午约13:00,通义实验室紧急召开了All Hands会议,阿里集团CEO吴泳铭向千问员工坦诚表示。12个小时前(北京时间3月4日凌晨0点11分),阿里千问大模型技术负责人林俊旸在X上突然宣布离职——林俊旸是阿里AI开源模型的核心推手,也是阿里最年轻的P10之一——行业一片哗然之时,Qwen的部分成员也无法接受团队灵魂人物的突然出走。

来自主题: AI资讯
8786 点击    2026-03-04 23:17
谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

深夜,两大科技巨头谷歌和 OpenAI 硬刚起来,相继推出了新版本大模型,分别是 Gemini 3.1 Flash-Lite、GPT‑5.3 Instant。

来自主题: AI资讯
5884 点击    2026-03-04 14:37
李曼玲、李飞飞、吴佳俊等联手:评估具身大模型的新范式!

李曼玲、李飞飞、吴佳俊等联手:评估具身大模型的新范式!

李曼玲、李飞飞、吴佳俊等联手:评估具身大模型的新范式!

全新的具身模型空间能力评估范式 Theory of Space 突破了传统静态图文问答的局限,系统性地考察基础模型能否像人一样,在部分可观测的动态环境中,通过自主探索来构建、修正和利用空间信念。该论文已被 ICLR 2026 接收。

来自主题: AI技术研报
10329 点击    2026-03-04 13:46
不止修bug:Agentic Coding评测走向复杂feature交付新阶段

不止修bug:Agentic Coding评测走向复杂feature交付新阶段

不止修bug:Agentic Coding评测走向复杂feature交付新阶段

在 Princeton 发布 SWE-Bench 之后,用真实世界代码仓库+可执行测试评测大模型软件工程能力,几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,也催生了一系列 SWE 系列 benchmark,在刻画模型 bug 修复能力方面发挥了重要作用。

来自主题: AI技术研报
7300 点击    2026-03-04 13:44