AI资讯新闻榜单内容搜索-AI推理

复旦女学霸建token工厂，Fireworks AI完成100亿D轮融资

这家公司是Fireworks AI，按现在流行的话说，Fireworks AI是一家Token工厂。既不训练前沿大模型，也不做面向消费者的AI应用，只做推理，帮企业把开源模型微调好、托管好，然后按调用量收钱。今年GTC大会上，黄仁勋和Lin Qiao有场对谈，老黄直言，“In a lot of ways, you're the TSMC of AI factories.”

来自主题: AI资讯

9446 点击 2026-07-22 16:36

DeepSeek造芯进展曝出！梁文锋3年前或已战略布局

今天，据路透社报道，三位知情人士透露，DeepSeek正在自研AI推理芯片，以减少对英伟达以及华为芯片的依赖。知情人士称，DeepSeek自研芯片的工作大约在一年前启动，其研发仍处于早期阶段。目前，DeepSeek正在接触外部合作伙伴，并与芯片设计企业、晶圆代工厂以及存储企业展开讨论。

来自主题: AI资讯

9164 点击 2026-07-07 21:47

独家｜AI推理芯片公司淬思科技完成首轮融资，Monolith、启盈同创联合领投

据悉，AI 推理芯片公司上海淬思科技有限公司（Trace Intelligence，以下简称“淬思”）近日完成孵化轮融资，砺思资本（Monolith）与启盈同创基金联合领投。本轮资金将用于首款面向智能体（Agent）推理的专用芯片研发与流片，以及核心团队扩充。

来自主题: AI资讯

9634 点击 2026-06-21 10:43

速递｜韩国AI推理芯片商XCENA完成1.35亿美元B轮融资，估值5.7亿美元

这一瓶颈是结构性的——这意味着每次请求都必须经过业内成本最高、功耗最大的芯片。这种低效正是总部位于韩国和美国的初创公司 XCENA 试图解决的问题。这家成立四年的初创公司设计了一款芯片，将计算能力置于更接近 DRAM 的位置

来自主题: AI资讯

8935 点击 2026-06-02 11:09

速递｜AI推理服务商Baseten拟融资10亿美元，估值110亿美元，ARR一年增长20倍

图片来源：Baseten AI 初创公司 Baseten 近期正与投资者洽谈，计划以 110 亿美元估值（含融资额）募集 10 亿美元资金，据知情人士透露。这将使该公司估值较三个月前公布的上一轮 50

来自主题: AI资讯

9269 点击 2026-05-28 09:53

谷歌第八代TPU双舰齐发，终结AI推理延迟，让智能体真正实现随叫随到

今天，谷歌在 Cloud Next '26 峰会上发布了其第八代 TPU 架构（TPU 8t 与 TPU 8i），TPU 8t 主攻训练，TPU 8i 主攻推理，将在 2026 年晚些时候上市。第八代 TPU 采用申请制，Google Cloud 用户如需使用，需要在官网提交登记需求。

来自主题: AI技术研报

8795 点击 2026-04-23 10:54

英伟达放弃GPU上LPU：新推理芯片被曝Groq即买即用，OpenAI第一个吃螃蟹

据悉，在即将开幕的3月圣何塞GTC大会上，黄仁勋将发布一套全新的AI推理系统—— 核心是一颗专为推理优化的新芯片。而且芯片的首位大客户已经敲定，就是刚刚完成1100亿美元巨额融资的OpenAI。

来自主题: AI资讯

10367 点击 2026-03-02 14:48

清华传奇姚顺宇立功！全新Gemini一夜血洗编程，全球仅7人能赢它

今天，Gemini 3 Deep Think重磅升级，几乎刷爆全领域的SOTA，标志着AI推理能力进入了全新维度。这一次，在科学研究和硬核工程领域，Deep Think堪称一个「最强大脑」。

来自主题: AI资讯

11023 点击 2026-02-13 10:32

OpenAI推理第一人创业了：要造“活到老学到老”的AI，先来融它70个亿

果然，离开了OpenAI，大家都有美好的未来。（doge

来自主题: AI资讯

9424 点击 2026-01-29 16:54

斯坦福×英伟达发布AI推理新范式，刷新了多领域SOTA

斯坦福与英伟达联合发布重磅论文 TTT-Discover，打破「模型训练完即定型」的铁律。它让 AI 在推理阶段针对特定难题「现场长脑子」，不惜花费数百美元算力，只为求得一次打破纪录的极值。从重写数学猜想到碾压人类代码速度，这种「激进进化」正在重新定义机器发现的边界。

来自主题: AI技术研报

8315 点击 2026-01-26 14:23