
小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品
小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品大模型推理速度提升50%以上,还能保证少样本学习性能!
大模型推理速度提升50%以上,还能保证少样本学习性能!
大模型的安全问题正在悄悄逼近。
5月中旬,OpenAI发布了全新的ChatGPT-4o,并邀请初代在线教育顶流可汗教育(Khan Academy)创始人Sal Khan出题、出提示词,让这款全新的4o来教他儿子做几何题。
是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
6月中旬,Iambic Therapeutics宣布完成超额认购的5000万美元B轮融资,由新投资者 Mubadala Capital 和 Exor Ventures 领投,卡塔尔投资局 (QIA) 以及老股东Abingworth、Illumina Ventures、Nexus Venture Partners、Coatue 和 Tao Capital Partners 参投。
纽约大学计算机科学助理教授、图灵奖得主Yann LeCun的学生Alfredo Canziani开新课了!
在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。
每个人都能拥有有检测AI造假的“照妖镜”了!
挖掘并建模多模态、多层次、多角度的AI合成线索。
瑞士领先的生物计算初创公司FinalSpark推出了首个在线平台Neuroplatform,使全球研究人员能够全天候访问16个人脑类器官,FinalSpark旨在开发世界上第一个生物处理器。这种生物处理器功耗比传统数字处理器低一百万倍,有可能减少计算机过度使用造成的环境影响。