纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。
「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。
不降低大模型算法精度,还能把芯片的算力利用效率提升 2~10 倍,这就是编译器的魅力。
大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。
Stability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥有更多参数和更强性能,据称在某些基准下能超越Llama 2 70B。
训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。
距离AI「杀死」搜索引擎,到底还差几步?
面向全年龄段用户的AI陪伴玩具。大模型横空出世后,让不少想要运用AI改造传统行业的创业者看到机会,玩具行业也是其中之一。在AI的加持下,原先仅能播放音乐、讲故事的早教玩具,也有了更多的“玩法”,可以实现多语种、多角色扮演对话,并且联网后还能提供丰富的天文地理知识。
AInno-75B正式亮相,AI在视觉识别和工业设计领域的应用范围进一步拓宽。Chat GPT、Sora、Suno等AI技术的接连问世,让人类社会经历了一场认知的革命。世人开始意识到,AI不仅是单一的工具本身,更是推动人类文明进步的新引擎。在这个数据驱动、智能互联的时代,我们不禁发问:当AI的触角延伸到工业的每一个角落,它将如何重塑工业的未来?
行业狂飙之际,版权利益争夺渐酣今年2月,美国OpenAI公司发布了首个视频生成模型“Sora”,再次掀起全球追进生成式人工智能的热潮。然而,据《纽约时报》近日报道,科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。
宁可犯错,不愿错过。 以国内大模型初创企业主要投资方的身份,腾讯和阿里再次站在了“金主爸爸”的位置。