租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂
租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。
元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。
无需真实奖励,哪怕用随机、错误的信号进行训练,大模型准确率也能大幅提升?
原人工智能大模型公司衔远科技(Frontier.ai)的AI产品负责人 Lyon(李昂),已正式启动新项目 “MIMOS”。与当前市场集中于底层模型研发或垂直应用开发的路径不同,Lyon此次创业将目光投向AI浪潮中更为关键的“产品化”环节,致力于探索连接前沿技术与实际商业价值的系统性方法论。
AI视频生成正从“静态输出”迈入“实时交互”阶段,一场内容创作革命即将到来。 近日,中国儒意宣布以1420万美元对爱诗科技进行战略投资,双方将围绕影视、流媒体、游戏等业务展开深度合作。 爱诗科技作为全
面对《the Big Technology Podcast》抛出的问题,Mistral AI的 CEO Arthur Mensch 表示:大模型肯定会走向商品化,当模型表现越来越接近,那么竞争就不在于模型本身,而在于如何让客户用起来。
最火世界模型,最火具身智能基建,联手了!
别再看「鉴AI攻略」了!当AI学会故意写错别字、流露人味,我们的直觉早已全线崩盘。这不只是技术的进化,更是一场关于平庸的生存危机。AI正在拼命演人,而我们却在越活越像机器。
让大模型轻松处理比自身上下文窗口长两个数量级的超长文本!
ICLR 2026 的 Rebuttal 结束了。当 OpenReview 上的喧嚣散去,我们发现,作者与审稿人之间漫长的拉锯战,最终往往只剩下一个核心分歧:「这个想法,以前真的没人做过吗?」
真正的 AI 时代新船票,至少由模型能力、基础设施、入口三部分构成。