AI资讯新闻榜单内容搜索-大模型

卡帕西点赞Transformer内置计算机！每秒3万Token吞吐，拿下世界最难数独

LLM推理已经顶尖，精确计算却跟不上。这局怎么破？卡帕西点赞的解决方法来了，在大模型内部构建一台原生计算机。新方法不搞外包那一套（不依赖任何外部工具），直接在Transformer权重里内嵌可执行程序。

来自主题: AI技术研报

9035 点击 2026-03-18 10:28

以「图」破局，HyperOffload定义超节点存储管理新范式

随着生成式 AI 迈入万亿参数时代，大语言模型（LLM）的推理与部署面临着前所未有的“显存墙”挑战。如何在超节点（SuperNode）复杂的异构存储架构下，实现海量张量的高效管理和调度，已成为大模型落地的胜负手。

来自主题: AI技术研报

10714 点击 2026-03-18 09:30

连OpenAI都在偷偷重仓！大模型的下一站，是「入侵」人类大脑

AI 巨头相继入局，脑机接口极速升温。格式塔科技获 1.5 亿元破国内纪录融资！借助 AI 解码，无创超声波脑机正告别实验室科幻，率先落地慢性疼痛与医疗康复，让前沿硬科技真正造福普通人的日常生活。

来自主题: AI资讯

8178 点击 2026-03-17 14:57

DeepSeek、GPT、Qwen，所有大模型架构图都有，Karpathy：宝藏画廊！

最近几年，大模型赛道好不热闹。

来自主题: AI技术研报

7225 点击 2026-03-17 08:50

不卷速度卷验证，陈天桥MiroMind精准预测15天后黄金价格

一睁眼！陈天桥带队的大模型黑马MiroMind再度满血归来—— 正式发布新一代重型推理智能体：MiroThinker-1.7和MiroThinker-H1。

来自主题: AI资讯

6518 点击 2026-03-16 15:11

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2，他们第一个原生多模态向量模型。文本、图像、视频、音频、文档，全部映射到同一个 3072 维向量空间。这是 Omni Embedding（全模态向量模型）的大趋势：一个架构吃下所有模态，从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5，大家都在往这个方向收敛。

来自主题: AI技术研报

6508 点击 2026-03-16 15:06