
不会真的以为有了AI,你就能赢了吧
不会真的以为有了AI,你就能赢了吧这个春节,我的手机已经彻底被DeepSeek占领了,曾几何时,区块链,虚拟货币,AR,VR一堆的新兴概念搞得一群人几乎陷入疯狂,结果现在因为多了一个新的人工智能模型,又有一群人肾上腺素飙升,嗨了。但我劝大家静一静,因为,这未必是好事儿。
这个春节,我的手机已经彻底被DeepSeek占领了,曾几何时,区块链,虚拟货币,AR,VR一堆的新兴概念搞得一群人几乎陷入疯狂,结果现在因为多了一个新的人工智能模型,又有一群人肾上腺素飙升,嗨了。但我劝大家静一静,因为,这未必是好事儿。
2月5日,彭博社报道,韩国代理总统崔相穆周三表示,DeepSeek的最新人工智能模型有可能重塑产业格局,并预测说,“这是一个新的冲击”。韩国政府将尽快成立一个“国家人工智能委员会”,以使韩国成为全球三大人工智能领先国家之一。
2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。
围绕 DeepSeek 的谣言实在太多了。 面对 DeepSeek R1 这个似乎「一夜之间」出现的先进大模型,全世界已经陷入了没日没夜的大讨论。从它的模型能力是否真的先进,到是不是真的只用了 550W 进行训练,再到神秘的研究团队,每个角度都是话题。
DeepSeek不主动追求旗下大模型的商业化,但它的推理模型R1的发布,却推动了全球整个大模型生态的商业化进程,也加速了国产AI生态的闭环。
大约一年前,Torres 又创立了 Agency,一家致力于用 AI 技术革新客户成功管理领域的初创公司。这家公司迅速获得了 1200 万美元的种子轮融资,展现了市场对 AI 客户管理解决方案的巨大需求。
今年 1 月,DeepSeek R1 引爆了全球科技界,它创新的方法,大幅简化的算力需求撼动了英伟达万亿市值,更引发了全行业的反思。在通往 AGI(通用人工智能)的路上,我们现在不必一味扩大算力规模,更高效的新方法带来了更多的创新可能。
Ilya Sutskever 在 NeurIPS 会上直言:大模型预训练这条路可能已经走到头了。上周的 CES 2025,黄仁勋有提到,在英伟达看来,Scaling Laws 仍在继续,所有新 RTX 显卡都在遵循三个新的扩展维度:预训练、后训练和测试时间(推理),提供了更佳的实时视觉效果。
来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法 CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。该论文已接受于 ICLR`2025,其代码也已同步开源。
先是“AI界拼多多”DeepSeek,从除夕前火到了现在。它凭借着“低训练成本”、“能和OpenAI一较高下的模型能力”,直接给全球来了一剂猛药,甚至让OpenAI、英伟达两大AI巨头公司感受到了“威胁”。关于DeepSeek成本、能力、创始人的“神话”和“误读”,还在此起彼伏出现。