AI资讯新闻榜单内容搜索-大模型

ICML 2026｜小模型也能「指挥」大模型RL后训练：清华&腾讯提出GPS，最高减少69% Rollout成本

来自清华大学与腾讯的研究者提出了 Generalizable Predictive Prompt Selection（GPS）。GPS 的做法很直接：先训练一个小型、可泛化的 Prompt Predictive Model（PPM），让它预测不同 prompt 在当前模型下的难度；再根据难度和 batch 多样性选择训练样本，从而减少无效 rollout。

来自主题: AI技术研报

8437 点击 2026-07-11 11:16

跟AI说“出片穿搭”，它真能听懂！淘宝ShopX让大模型直接“卖货”了

团队提出了ShopX：一个面向agentic shopping的电商大模型。它不仅仅是在搜索框外面套一个会“说话”和“调用工具”的LLM，而是赋予模型直接进入商品空间的能力，让大模型成为商品履约的核心，学会在商品空间中规划、检索、排序、组合和生成结果，进而减少接口损耗。

来自主题: AI技术研报

9573 点击 2026-07-11 11:14

奥特曼撒谎？OpenAI 5.6突发反转，发布无需批准！

6月26日，奥特曼公开说：应白宫要求，GPT-5.6今天只能限量预览，我们正在和美国政府合作，尽快推进全面开放。刚刚，白宫与商务部紧急出面「澄清」，极力撇清关系。政府官员对媒体明确表示：大模型的发布不需要任何政府许可，分发决定权「完全在企业手中」，所谓的安全测试与会议也「完全是自愿的」

来自主题: AI资讯

8702 点击 2026-07-11 11:09

全球首个！「具身原生」世界动作模型LingBot-VA 2.0来了

蚂蚁集团旗下具身智能公司蚂蚁灵波，把这块最难的拼图拍上了桌：LingBot-VA 2.0——行业第一个具身原生预训练模型。所谓「具身原生」，一句话说清楚：不是拿现成的数字世界模型做嫁接，而是从数据、训练目标到模型架构，每一层都为「机器人在物理世界干活」而生—

来自主题: AI资讯

9009 点击 2026-07-10 15:14

多模态 Agent 记忆，为什么不能当成升级版多模态RAG？

多模态 Agent 的记忆系统，过去很容易被理解成一个升级版 RAG：图片、图表、PDF 进来之后，先抽取内容、做 embedding、写进向量库；用户提问时，再用 query 做检索，把命中的top-k图片、文档页或图表一并塞进上下文，再交给多模态模型回答。整个过程中，所有原始模态信息都会不加选择的塞给大模型。

来自主题: AI技术研报

8313 点击 2026-07-10 10:39

民办大模型MiniMax努力专升本

葬AI身边的朋友常常有个疑问：为什么MiniMax M3做的不够好（问了很多在做模型测评的朋友，也是类似看法），但市场仍然觉得他们是第一梯队？我朋友@朱亦辉的解释是，MiniMax M3的核心科技是叙事能力，让外界觉得他们和Kimi是一个级别，达到一个强行双骄的效果。

来自主题: AI资讯

10356 点击 2026-07-10 10:31

独家 | 阿里孵化的元境内测“JellyToken”大模型超市，抢滩AI商用市场

由阿里巴巴集团孵化的空间智能企业“元境”，正在内测“JellyToken”，平台定位AI大模型一站式超市，支持一套密钥调用多款模型。该平台整合了Qwen3.7、Seedance2.0等多款国产大模型，面向个人创作者、中小团队、企业推出付费统一调用服务。

来自主题: AI资讯

9010 点击 2026-07-09 17:07

现代AI之父新作：13个大模型实测，检索agent真的可信吗？

近日，来自KAUST生成式AI卓越中心、吉林大学、浙江大学、瑞士人工智能实验室等机构，由包括「现代人工智能之父」Jürgen Schmidhuber在内的研究者组成的团队，发布了一篇回答这个问题的研究论文。

来自主题: AI技术研报

8360 点击 2026-07-09 16:52

工信部首次定调：Claude Code危害严重！

今日，工业和信息化部网络安全威胁和漏洞信息共享平台（NVDB）发布公告，其近日监测发现，美国AI大模型公司Anthropic旗下AI编程工具Claude Code存在安全后门隐患，该工具内置监控机制，可在未经用户同意的情况下向远程服务器回传用户地域、身份标识等敏感信息。工信部建议立即卸载相关受影响版本。

来自主题: AI资讯

10241 点击 2026-07-09 09:40

1/8 参数，跑赢 80B 大模型：Boogu-Image 是黑马还是鸡肋？

2026 年 6 月，HuggingFace 上一个名为 Boogu-Image-0.1 的开源模型，在上传以后迅速引爆了 AI 圈。这款模型最引人注目的地方，在于它以区区 10B 的参数规模，就在多项关键能力上超过了很多参数量更大的模型。

来自主题: AI资讯

8554 点击 2026-07-08 22:15