
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」
一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」
纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。
能打得过GPT-4的开源模型出现了!
「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。
训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。
关注 OpenAI核心创始成员Andrej Karpathy 深度分享AI大模型发展及Elon管理法则。近日,OpenAI核心创始成员Andrej Karpathy(已于24年2月离职)在红杉资本进行了一场精彩的分享。
「这是自 Karpathy 和我 2015 年启动这门课程以来的第 9 个年头,这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n,又一次开课了。
红杉近日组织了他们的AI Ascent 2024主题活动。作为VC大佬的红杉出手还是很不凡,除了题为“人工智能的机遇” 开场演讲颇有营养外,已经分享出来的Andrej Karpathy和吴恩达两位AI大神的现场演讲更是不容错过。
在 AI 落地如何 ToB 业务上,有赞是属于「跑得快」的一批玩家。在 2024 年 1 月 FounderPark 的一场直播中,有赞创始人兼 CEO 白鸦就从 SaaS 产品经理的角度,聊了聊大模型时代的产品应该怎么做。而在最近的一场直播中,白鸦则详细分享了有赞如何用 AI 改造他们的 SaaS 服务流程。
一家大模型初创公司从创立到训练出大模型,要克服怎样的难题?前谷歌科学家离职后创业一年,发文自述算力是训练大模型的难点。