Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式
Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式2023 年初,Jason Wei 加入了 OpenAI,参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。
搜索
2023 年初,Jason Wei 加入了 OpenAI,参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。
2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。
斯坦福大学最新AI进展!开源STORM&Co-STORM系统,只需填写主题,就可以全面整合资源,避开信息盲点生成高质量长文。
AI 需要的钱,可比造车要多多了。
复旦大学等机构的研究人员最新提出的AI内容检测器ImBD涵盖多任务检测(润色、扩写、改写、纯生成),支持英语、中文、西班牙语、葡萄牙语等多种主流语言;仅需500对样本、5分钟训练时间,就能实现超越商用检测器!
2022年,我们打赌说transformer会统治世界。 我们花了两年时间打造Etched chip,这是世界上第一个用于transformer(ChatGPT中的“T”)的专用芯片。
高瞻远瞩也好、盲目跟风也罢,继OpenAI携ChatGPT掀起AIGC热潮之后,如何用AI“赋能”自家业务就成为这两年各行各业的一个共同命题,其中自然也包括一众本地生活服务平台。此前在今年4月,饿了么零售商家SAAS平台“翱象”面向商家推出“AI经营助手”功能。
过去一段时间,“预训练终结”成为了 AI 领域最热烈的讨论之一。OpenAI的GPT系列模型此前大踏步的前进,预训练是核心推动力。而前 OpenAI 首席科学家 Ilya Sutskever、预训练和scaling law(规模定律)最忠实的倡导者,却宣称预训练要终结了、scaling law要失效。由此,引发了大量争议。
穿越重重迷雾,OpenAI模型参数终被揭开!一份来自微软华盛顿大学医疗论文,意外曝光了GPT-4、GPT-4o、o1系列模型参数。让所有人震惊不已的是,GPT-4o mini仅8B。
2024年,我们居然进步这么大。