
刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错
刚刚,开源大模型的新王诞生了:超越GPT-4o,模型还能自动纠错快速更迭的开源大模型领域,又出现了新王:Reflection 70B。 横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。 这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。
快速更迭的开源大模型领域,又出现了新王:Reflection 70B。 横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。 这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。
开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。新模型名为Reflection 70B,使用一种全新训练技术,让AI学会在推理过程中纠正自己的错误和幻觉。
大模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。
视觉与机器人学习的深度融合。
还能玩纸牌游戏。
智谱AI发布新视觉模型,看得懂视频,也看得透网页源代码。
大模型竞技场规则更新,GPT-4o mini排名立刻雪崩,跌出前10。
在与 GPT-4o 的全面较量中,GLM-4-Plus 已经可以在大多数任务上做到逼近甚至在某些任务上实现了超越。还有 One More Thing:清言上线了视频通话功能,首批面向部分用户开放。
GPT-4o能挂在脖子上了?还能当手环、别在口袋上,实时AI转录。
新的最强开源多模态大模型来了!