
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败
Karpathy新实验火了!一个「表情」占53个token,DeepSeek-R1苦思10分解谜失败一个简单的笑脸😀可能远不止这么简单?最近,AI大神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘密?如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是,这种「数据隐藏术」甚至能对AI模型进行「提示注入」!
一个简单的笑脸😀可能远不止这么简单?最近,AI大神Karpathy发现,一个😀竟然占用了多达53个token!这背后隐藏着Unicode编码的哪些秘密?如何利用这些「隐形字符」在文本中嵌入、传递甚至「隐藏」任意数据。更有趣的是,这种「数据隐藏术」甚至能对AI模型进行「提示注入」!
机器学习大神Jeff Dean亲自为你解答,做一名计算机科学家,是一种怎样的体验。
之前还是一个小透明,现在立马变成下一个 ChatGPT。它是谷歌目前最成功的 AIGC 产品。
两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!
AI大神李沐老师时隔1年多,终于回归B站“填坑”经典论文精读系列了!
离职OpenAI五个月后,AI大神Karpathy终于宣布自创业了。一家专注于AI+教育原生学校Eureka Labs,未来将面向全球80亿人,从0按需辅导AI。从产业界转身教育事业,是Karpathy近20年来的终极梦想,现如愿成真。
终于,AI大神李沐回来了!带着他的大模型创业最新成果——
纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。
「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。
训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。