Karpathy刚进Anthropic,转头又投了它

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Karpathy刚进Anthropic,转头又投了它
8575点击    2026-06-24 16:59

AI大神Karpathy重注!一家叫Engram公司出山,13个人团队,要让AI永久记住你。


13人公司,成立8个月,估值干到了6亿美金!


就在今天,一家名为Engram的AI初创公司结束隐身、正式亮相,一口气拿下了9800万美元融资。


Karpathy刚进Anthropic,转头又投了它


这13个人,到底在做一件什么样的事,值这么多钱?


答案只有两个字:记忆!


最关键的是,仅用1%-10%的Token,Engram便能让大模型做到过目不忘。


而且,每一次对话,它都能实现不断自我改进。


Karpathy刚进Anthropic,转头又投了它


投资人Karpathy第一时间送上了祝贺。


Karpathy刚进Anthropic,转头又投了它


成立8个月,要让AI「永不失忆」


Engram这个词,本身就来自神经科学,指的是记忆在大脑中留下的「痕迹」。


一家做AI记忆的公司,名字就叫「记忆痕迹」,野心写在脸上。


Karpathy刚进Anthropic,转头又投了它


团队将致力于解决的核心痛点,生动地概括为——「天才陌生人」(genius stranger)。


今天的AI,智商爆表,记性却烂得吓人。


它能处理海量信息、攻克复杂难题,但在面对具体业务时,认知水平甚至不如一名刚入职的实习生。


于是,荒谬的一幕反复上演:它不得不一遍遍重读相同的文档,一次次重新学习业务背景;


Karpathy刚进Anthropic,转头又投了它


每面对一个新问题,都要把整个组织的知识库从头到尾「重新发现」一遍。


这不光蠢,还烧钱。随着上下文越来越大,模型越贵、越容易犯迷糊。


不卷大模型,专卷「记忆」


Engram的打法,跟其他实验室完全不在一个维度。


它的思路是,从一个强大的预训练模型起步,把训练算力死死砸在「上下文」上。


听起来很美,技术上凭什么落地?


答案就藏在CTO Sabri Eyuboglu 手里的王牌——Cartridges技术里。


这是近两年「把一大堆文档压成可复用记忆」的代表性方法之一,由斯坦福团队打造,背后的导师正是机器学习大牛、Engram联合创始人Chris Ré。


Karpathy刚进Anthropic,转头又投了它


再来看一组具体的数字,就可以理解背后真相了——


当AI阅读一份7万字、约400KB的法律合同时,它在内部生成的记忆体积,会瞬间暴涨到100GB以上。


足足比原始文件大了25万倍,这正是AI变得又慢又贵的罪魁祸首。


Cartridges的思路,堪称暴力美学——


与其每次临时把整篇文档塞进上下文窗口,不如提前花一大笔算力,离线把它「学」成一个小小的记忆模块。


Karpathy刚进Anthropic,转头又投了它


团队管这个过程叫「self-study」:让模型先围绕语料自己生成大量合成对话,再把这些「学习痕迹」蒸馏进一个紧凑的缓存里。


最终,内存占用降到原来的约1/40,解码吞吐量飙升25倍以上。


更妙的是Engram的架构哲学:它把模型的「推理层」和「记忆层」彻底拆开。


推理负责思考,记忆负责「认得你」。


这样一来,AI就能在几秒到几小时内,实时吸收个人偏好、对话历史和新到的数据,而不用从头重训一遍。


一支「全明星」团队


Engram这支队,来头一个比一个大。


去年10月,Engram孵化于斯坦福AI实验室,CEO是以色列研究者Dan Biderman。


他曾获得了哥伦比亚大学计算神经科学博士学位,后来进了Stanford AI实验室做博士后。


Karpathy刚进Anthropic,转头又投了它


更有意思的,是Biderman痴迷「记忆」的起点。


小时候,他总想着各种办法,去帮已经失忆的祖母,重新记起关于他和兄弟姐妹的那些小事。


这支13人的队伍,成员来自斯坦福、伯克利、康奈尔。


第一名员工,是创始人的妻子Dr. Natalie Biderman,同样是一位斯坦福的记忆研究者。


据Biderman透露,团队里不少人,是拒绝了Anthropic和谷歌的橄榄枝,才选择跳上这条小船。


在如今这个抢人抢到刺刀见红的AI圈,这份「弃明投暗」,含金量还在上升。


Karpathy刚进Anthropic,转头又投了它


AI可以记住你了


说到底,Engram押的是AI范式的下一次转向。


过去几年,全行业信仰「Scaling Law」:模型越大、数据越多、越聪明。


但Engram提出了一条新的Scaling轴:把算力砸在「学习和内化个人的数据」上。


模型越用越懂你,越用越聪明。


学习的对象,从公开互联网,变成了「你」和「世界本身」。学习的频率,从每天,逼近每一刻。


这正是通往ASI路上,最关键的两块拼图之一:让智能不再静止,而是持续生长。


Engram只有13个人,但它想做的,是给AI装上一段永不褪色的记忆。


而记忆,恰恰是智能开始真正理解世界的起点。


参考资料:

https://x.com/EngramLab/status/2069465879696576844?s=20


文章来自于"新智元",作者 "桃子"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT