AI资讯新闻榜单内容搜索-AR

独家丨ListenHub完成200万美元融资，靠“自来水”做到ARR 300万美元进军北美

据我们独家获悉，ListenHub产品的母公司MarsWave完成了200万美元天使＋轮融资。本轮由天际资本领投，小米联合创始人王川跟投。同时，MarsWave也对外公布了盈利状况：目前公司年经常性收入（ARR）已突破300万美元，并达到月度盈亏平衡，成为少数已跑通盈利模型的AI原生公司。

来自主题: AI资讯

11136 点击 2026-01-01 10:19

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

，时长 00:20 视频 1：单样例推理速度对比：SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)（注：NVIDIA 平台

来自主题: AI技术研报

8980 点击 2026-01-01 10:09

体验英伟达 AI 个人超算「核弹」DGX Spark，能微调出 DeepSeek R2 吗

最近，APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算，英伟达 DGX Spark；到手的第一感觉，就是「小而美」。这电脑也太小了，没有 Mac Studio 那般笨重，可能就和 Mac Mini 差不多大；然后是银色的亮和用来散热的金属丝网又让它有点不一样，是专属的硬核美感。

来自主题: AI资讯

9190 点击 2025-12-31 15:19

马斯克买了新厂房上GPU，2GW供电规模，“巨硬”更更硬了

马斯克“巨硬计划”新消息，第三栋专属厂房已经买下来了，代号MACROHARDRR。果然更硬核，老马透露，其将具备2GW供电规模。若参照此前曝光的（200MW支持11万台GB200）的功耗密度与架构效率推算，可支持约110万台英伟达GB200 NVL72 GPU。

来自主题: AI资讯

11586 点击 2025-12-31 15:12

Qwen负责人转发2025宝藏论文，年底重读「视觉领域GPT时刻」

2025最后几天，是时候来看点年度宝藏论文了。

来自主题: AI技术研报

6791 点击 2025-12-31 14:12

自回归因果注意力也能并行解码？上交联合UCSD突破LLM推理瓶颈，模型代码全开源

在大语言模型（LLM）落地应用中，推理速度始终是制约效率的核心瓶颈。传统自回归（AR）解码虽能保证生成质量，却需逐 token 串行计算，速度极为缓慢；扩散型 LLM（dLLMs）虽支持并行解码，却面

来自主题: AI技术研报

8735 点击 2025-12-31 09:21

敏捷开发「BMAD」也推出了Agent Skills，CC直接用｜斩获2.6万star

BMAD推出了： BMAD Method v6 for Claude Code skills。这不仅仅是一套Skills集，它是一套将敏捷开发方法论（Agile Methodology）与AI原生能力深度融合的工程框架。它将Claude Code从一个“更聪明的编辑器”转变为一支具备9种专业角色、15种标准工作流的“全栈敏捷开发团队”。

来自主题: AI资讯

9590 点击 2025-12-30 15:17