AI资讯新闻榜单内容搜索-模型

可自定义的推理框架SoT-Agent，通过小路由模型自适应推理，更灵活，更经济 | 最新

本文介绍了一项突破性的AI推理技术创新——思维草图(SoT)框架。该框架从人类认知过程中获取灵感，通过一个200M大小的路由模型将LLM引导到概念链、分块符号化和专家词汇三种推理范式，巧妙地解决了大语言模型推理过程中的效率瓶颈。

来自主题: AI技术研报

5944 点击 2025-03-11 16:21

ICLR 2025 | 原生3D+流匹配，现有SOTA被GaussianAnything超越

在 ICLR 2025 中，来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything，针对现有问题引入了一种交互式的点云结构化潜空间，实现了可扩展的、高质量的 3D 生成，并支持几何-纹理解耦生成与可控编辑能力。

来自主题: AI技术研报

6642 点击 2025-03-11 16:13

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。

来自主题: AI技术研报

4627 点击 2025-03-11 09:32

微软开源多模态AI基础模型Magma！无需额外微调轻松拿捏网页、机器人

微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。

来自主题: AI技术研报

5892 点击 2025-03-10 22:22

已节省数百万GPU小时！字节再砍MoE训练成本，核心代码全开源

字节对MoE模型训练成本再砍一刀，成本可节省40%！刚刚，豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。

来自主题: AI技术研报

5763 点击 2025-03-10 21:57

富士康开发出台湾首个推理大模型FoxBrain，性能落后于DeepSeek

北京时间3月10日，据《华尔街日报》报道，富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型，性能上落后于DeepSeek的部分大模型。鸿海周一表示，已自主研发了具备推理能力的人工智能(AI)大语言模型FoxBrain，并在四周内完成训练。FoxBrain最初为公司内部使用而设计，具备数据分析、数学运算、推理以及代码生成的能力。

来自主题: AI资讯

8938 点击 2025-03-10 17:46