一年后,DeepSeek-R1的每token成本降到了原来的1/32
一年后,DeepSeek-R1的每token成本降到了原来的1/32几天前,DeepSeek 毫无预兆地更新了 R1 论文,将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容,包括首次公开训练全路径,即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline,以及「Aha Moment」的数据化验证等等。
几天前,DeepSeek 毫无预兆地更新了 R1 论文,将原有的 22 页增加到了现在的 86 页。新版本充实了更多细节内容,包括首次公开训练全路径,即从冷启动、训练导向 RL、拒绝采样与再微调到全场景对齐 RL 的四阶段 pipeline,以及「Aha Moment」的数据化验证等等。
最近,奥特曼的焦虑肉眼可见。去年年底,谷歌Gemini 3横空出世,一举横扫各大榜单,将ChatGPT狠狠拽下了神坛。为了抢回AI皇冠,奥特曼不得不拉响「红色警报」。
近年来,大语言模型在算术、逻辑、多模态理解等任务上之所以取得显著进展,很大程度上依赖于思维链(CoT)技术。所谓 CoT,就是让模型在给出最终答案前,先生成一系列类似「解题步骤」的中间推理。 这种方式
站在2026年的CES,回望2024年1月,我曾亲历那场处于AI狂热顶点的CES。那一年,三星豪掷千金买下LVCC中央馆最大的广告牌,「AI for ALL」的口号如雷贯耳。
这是我从 腾讯裸辞 成为自由职业以后,写的第三篇年终总结。 前两年的年终总结,以罗列产品为主。 2023,我做过的 AI 项目 2024,我追过的 AI 风口 过去两年,我基本上把能做的 AI 产品都
Information爆料称,DeepSeek将计划在2月中旬,也正是春节前后,正式发布下一代V4模型。据称,DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。
今天我们就借着科技领域的东风,花1分钟时间来了解一下MiniMax的创始人闫俊杰的个人履历和创业故事:1989年,闫俊杰出生于河南某县城。闫俊杰的爸爸是一名初中老师,妈妈是一名公务员,尽管闫俊杰说小时候县城的教育资源相对匮乏,但他父母都有稳定的工作,想必他的童年也比较幸福。
「新皮层」分别在2023年和2024年参与过对两家公司的深入访谈。今天看,两家公司的创始人当时讲述的内容仍然有助于理解两家公司的内核差异。因此重发两篇旧文:
「新皮层」分别在2023年和2024年参与过对两家公司的深入访谈。今天看,两家公司的创始人当时讲述的内容仍然有助于理解两家公司的内核差异。因此重发两篇旧文:
2026年1月5日,由陈天桥和清华AI学者代季峰联合发起的MiroMind团队,正式发布了自研旗舰搜索智能体模型MiroThinker 1.5。这个消息本身并不算特别,毕竟最近几个月几乎每周都有新模型发布。但当我深入了解后发现,这个模型背后代表的思路,可能会彻底改变我们对AI能力边界的认知。