AI资讯新闻榜单内容搜索-CoE

700万参数击败DeepSeek R1等，三星一人独作爆火，用递归颠覆大模型推理

来自加拿大蒙特利尔三星先进技术研究所（SAIT）的高级 AI 研究员 Alexia Jolicoeur-Martineau 介绍了微型递归模型（TRM）。这个 TRM 有多离谱呢？一个仅包含 700 万个参数（比 HRM 还要小 4 倍）的网络，在某些最困难的推理基准测试中，

来自主题: AI技术研报

9964 点击 2025-10-10 13:08

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

DeepSeek MoE“变体”来了，200美元以内，内存需求减少17.6-42%！名叫CoE（Chain-of-Experts），被认为是一种“免费午餐”优化方法，突破了MoE并行独立处理token、整体参数数量较大需要大量内存资源的局限。

来自主题: AI技术研报

7603 点击 2025-03-04 20:02

AIPGPT完成数百万美元融资，深耕AI Agent+IP短视频垂类，开启全球战略

近日，AIP GROUP完成天使轮融资，融资金额数百万美元，由算力基金Coevolution独家投资。AIP GROUP旗下产品AIPGPT为AI驱动的一站式IP短视频创作平台，自上线后已在国内、北美等多个城市和地区提供服务。

来自主题: AI资讯

7220 点击 2024-12-30 14:17

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。

来自主题: AI技术研报

12280 点击 2024-09-20 19:58

大模型的中场战事：CoE or MoE?

残暴的欢愉，终将以残暴结束。当盛宴开启之时，没人想到，大模型的淘汰赛，会来的如此之快。火药味首先表现在创投市场。PitchBook 最新报告披露，相比2023年一季度，全球2024年一季度大模型融资额，从216.9亿美元增长到了258.7亿美元，但涉及的交易数量，却从 1909 笔下滑至1545笔——产业格局正迅速向强者收拢。

来自主题: AI资讯

9946 点击 2024-08-03 15:09