
李沐老师回归B站!带着大模型创业成果填坑来了
李沐老师回归B站!带着大模型创业成果填坑来了终于,AI大神李沐回来了!带着他的大模型创业最新成果——
终于,AI大神李沐回来了!带着他的大模型创业最新成果——
最新版本大模型,6 分钱 100 万 Token。
去年10月,硅谷VC巨头Vinod Khosla曾在X发文,“忧心忡忡”地称美国的开源大模型都会被中国抄去。万万没想到,8个多月过去,射出的回旋镖最终扎回了自己的心。
抄袭框架和预训练数据的情况,是更狭义的套壳。
众所周知,对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说,构建高质量的网络规模数据集是非常重要的。然而,即使是最先进的开源 LLM 的预训练数据集也不公开,人们对其创建过程知之甚少。
斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生还跟另一位作者切割了。
面壁智能回应:“深表遗憾”,这也是一种“受到国际团队认可的方式”。
大模型抄袭丑闻总是不断。
首个“脑PU”来了!由“16核”类人脑器官(human brain organoids)组成。
研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语言生成任务上均表现出显著优势,且不会增加训练时间,推理速度还能提升至三倍。