AI资讯新闻榜单内容搜索-大模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型

条条电路通罗马：大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马：大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马：大模型可解释性的「唯一机制」可能从一开始就不存在

长期以来，机制可解释性（mechanistic interpretability）领域有一个几乎从未被明说、却被视为理所当然的前提：模型对于同一种任务的能力或表现，背后对应着一条唯一的、或近乎唯一的内部「电路」（circuit）。该领域的研究者们之所以要做「电路发现」（circuit discovery），是为了要把这些「特定的」电路找出来。

来自主题: AI技术研报

8204 点击 2026-06-30 15:12

DeepSeek点燃大模型效率之争，阶跃火速接棒：JetSpec让大模型解码速度最高提升近10倍

DeepSeek点燃大模型效率之争，阶跃火速接棒：JetSpec让大模型解码速度最高提升近10倍

DeepSeek点燃大模型效率之争，阶跃火速接棒：JetSpec让大模型解码速度最高提升近10倍

近期，DeepSeek发布DSpark让大模型推理效率再次成为行业焦点。

来自主题: AI技术研报

10475 点击 2026-06-30 15:11

Claude「断电」背后：中国基准首次捅开了AI万亿市场「死穴」

Claude「断电」背后：中国基准首次捅开了AI万亿市场「死穴」

Claude「断电」背后：中国基准首次捅开了AI万亿市场「死穴」

6月22日Claude全家桶集体宕机，只是冰山一角。当最强大模型被丢进真实机房直面「幽灵故障」，AISHPerf-智算运维智能体评测基准给出残酷答案：全军覆没，无一过50分。这道鸿沟，第一次被量化。

来自主题: AI资讯

6643 点击 2026-06-30 10:21

给Transformer变个形，LLM竟能变得更聪明

给Transformer变个形，LLM竟能变得更聪明

给Transformer变个形，LLM竟能变得更聪明

2026 年 6 月，大模型行业正在经历一场前所未有的「开源海啸」：英伟达放出了 550B 参数的混合架构模型，谷歌送出多模态的 Gemma 新版本，智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报

8257 点击 2026-06-30 10:20

AI助手不该只等人提问：清华团队两项新研究，探索理解用户与适时互动

AI助手不该只等人提问：清华团队两项新研究，探索理解用户与适时互动

AI助手不该只等人提问：清华团队两项新研究，探索理解用户与适时互动

如今，大模型越来越擅长回答问题了，但当 AI 不再只停留在聊天窗口，而是走向智能眼镜、可穿戴设备乃至家庭机器人时，问题会随之改变。用户未必有时间把需求完整说出来，也未必希望助手随时插话。更理想的助手，应该能在现场真正理解人，在用户需要的时候出现，在不合适的时候保持安静。

来自主题: AI技术研报

6532 点击 2026-06-30 09:55

ZenMux 的 Token 经济学实验：当主流模型的价格被降到 DeepSeek 斩杀线，你会选择谁？

ZenMux 的 Token 经济学实验：当主流模型的价格被降到 DeepSeek 斩杀线，你会选择谁？

ZenMux 的 Token 经济学实验：当主流模型的价格被降到 DeepSeek 斩杀线，你会选择谁？

你有没有想过一个问题：我们平时选模型，到底有多少是因为它真的好用，又有多少是因为它便宜？

来自主题: AI产品测评

10061 点击 2026-06-30 09:55

全程靠AI ！哈佛博士车库手搓「老年痴呆新药」，成本仅千分之一，百万网友围观

全程靠AI ！哈佛博士车库手搓「老年痴呆新药」，成本仅千分之一，百万网友围观

全程靠AI ！哈佛博士车库手搓「老年痴呆新药」，成本仅千分之一，百万网友围观

就在今天凌晨，哈佛博士Douglas Yao在X宣布，研发了一款针对阿尔茨海默病的新药PAC-832，引发了数百人的围观。这是世界上第一个选择性GalR1拮抗剂，创始人表示全程使用了机器人自动化技术和AI大模型。

来自主题: AI资讯

9365 点击 2026-06-29 20:18

ICML 2026 Oral｜大模型的能力从哪些训练数据来？北大&智源提出「机理数据归因」

ICML 2026 Oral｜大模型的能力从哪些训练数据来？北大&智源提出「机理数据归因」

ICML 2026 Oral｜大模型的能力从哪些训练数据来？北大&智源提出「机理数据归因」

近年来，大语言模型展现出了越来越强的能力，从上下文学习（In-Context Learning, ICL）到复杂推理、代码生成，这些能力不断刷新人们对模型能力边界的认知。

来自主题: AI技术研报

9499 点击 2026-06-29 09:19

从第一性原理看机器人AI：为什么它比大模型更难？

从第一性原理看机器人AI：为什么它比大模型更难？

从第一性原理看机器人AI：为什么它比大模型更难？

这篇来自 Interlatent（一家聚焦具身智能后训练与部署的早期创业公司）的文章，试图从第一性原理出发，把现代 AI 机器人技术重新讲清楚：一个机器人到底如何理解世界，如何生成动作，又为什么会在数据、延迟和泛化上遇到如此多的困难。

来自主题: AI技术研报

7755 点击 2026-06-29 09:15

这次是阿里！中国的大模型团队快被 Anthropic 告完了

这次是阿里！中国的大模型团队快被 Anthropic 告完了

这次是阿里！中国的大模型团队快被 Anthropic 告完了

短短四个月，四家中国顶级AI公司被Anthropic接连点名，且没有停手的迹象。Anthropic向美国参议院银行委员会递交了一封信，矛头直指阿里Qwen团队。报告披露了一串数字：从4月22日到6月5日，整整45天，阿里相关运营者利用2.5万个账号，完成了2880万次交互。

来自主题: AI资讯

9716 点击 2026-06-27 13:22

上一页当前第11页,共547页下一页