科学家Yann LeCun:聊聊大模型如何思考与深度学习
科学家Yann LeCun:聊聊大模型如何思考与深度学习大模型发展究竟由工程还是科学驱动?
来自主题: AI资讯
8472 点击 2024-08-11 11:04
大模型发展究竟由工程还是科学驱动?
在软件开发的世界里,代码的生成、编辑、测试和调试一直是核心活动。
牛津大学教授Nick Bostrom在学术界投下一枚炸弹——读博需要三思而后行。随着人工智能的飞速发展,也许是时候该质疑那些长期的学术投资了。
在人工智能迅猛发展的今天,我们不断探索着机器的智能化,但却往往忽视了这些智能体如何深层地理解我们 —— 它们的创造者。
用 FlexAttention 尝试一种新的注意力模式。
如果我们今天要谈论科技或风险投资,那么接下来的话题只会让我们想到 AI.
前段时间冲上热搜的问题「9.11比9.9大吗?」,让几乎所有LLM集体翻车。看似热度已过,但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷,以及未来的潜在改进方向。
有CPU就能跑大模型,性能甚至超过NPU/GPU!
最强数学大模型,现在易主!
GPT-4o的怪癖暴露了,还是被官方公开的!