ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议,就连图灵奖得主 Yann LeCun 也参与了进来。
最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议,就连图灵奖得主 Yann LeCun 也参与了进来。
大模型是世界模型吗?UA微软等机构最新研究发现,GPT-4在复杂环境的模拟中,准确率甚至不及60%。对此,LeCun激动地表示,世界模型永远都不可能是LLM。
GPT-4o掀起一股全模态(Omni-modal)热潮,去年的热词多模态仿佛已经不够看了。
才用了112台A800,就能训出性能达GPT-4 90%的万亿参数大模型?智源的全球首个低碳单体稠密万亿参数大模型Tele-FLM,有望解决全球算力紧缺难题!此外,全新思路的原生多模态「世界模型」Emu 3等都浅亮相了一把。2024的智源大会,依然是星光熠熠,学术巨佬含量超标。
刚刚,英伟达全新发布的开源模型Nemotron-4 340B,有可能彻底改变训练LLM的方式!从此,或许各行各业都不再需要昂贵的真实世界数据集了。而且,Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至可以和GPT-4掰手腕!
中国科学院大学和中科数字大脑研究院的研究人员,引入了上帝之点和死亡之点,构建了智能体演化的动力学模型——Flight Model。他们发现,以GPT-4为代表的AI已经接近了人类成人智能水平,但尚未表现出自我意识证据。并且,具有自我意识到AGI,在科学原理上存在目前无法克服的局限性。
苹果AI首秀真的缺乏新意吗?
前段时间,随着 GPT-4o、Sora 的陆续问世,多模态模型在生成式方面取得的成绩无可否认,而人工智能的下一个革命性突破将从何处涌现,引起了大量学者和相关人士的关注。
苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。
GPT-4o再次掀起多模态大模型的浪潮。