开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集
开源大模型新王干翻GPT-4o,新技术可纠正自己幻觉,数学99.2分刷爆测试集开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。新模型名为Reflection 70B,使用一种全新训练技术,让AI学会在推理过程中纠正自己的错误和幻觉。
来自主题: AI资讯
6529 点击 2024-09-06 15:33
开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。新模型名为Reflection 70B,使用一种全新训练技术,让AI学会在推理过程中纠正自己的错误和幻觉。
大模型卷了一年后之后,今年 OpenAI 发布的节奏明显放缓,但最新的模型已经在路上了。
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。
大模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。
内含一键部署教程
视觉与机器人学习的深度融合。
斯坦福和NYU的研究者发现,GPT-4这样的「AI人」,可以被用来复制社会科学实验了。调查了1万个AI,结果比真人还真?
还能玩纸牌游戏。
智谱AI发布新视觉模型,看得懂视频,也看得透网页源代码。
大模型竞技场规则更新,GPT-4o mini排名立刻雪崩,跌出前10。