独家 | “文科生”微博,搞出一个数学学霸大模型
独家 | “文科生”微博,搞出一个数学学霸大模型近日,微博发布了首个开源模型 VibeThinker,它以15亿的微小参数 与7800美元的极低成本,在国际顶级数学测试中获得相对高分,刷新智能极限。这一结果,无异于以轻巧之姿,刺向了“规模即智能”的行业铁律。
近日,微博发布了首个开源模型 VibeThinker,它以15亿的微小参数 与7800美元的极低成本,在国际顶级数学测试中获得相对高分,刷新智能极限。这一结果,无异于以轻巧之姿,刺向了“规模即智能”的行业铁律。
学术界看不下去了,直接戳破:华尔街在尬吹谷歌TPU!起因是Meta被曝要和谷歌签订数十亿美元的TPU订单,消息曝出后英伟达盘中最大跌幅达到了7%,按照现在的市值计算,一举蒸发了超3000亿美元。反观谷歌,在盘中情绪最热烈时涨幅一度达4%,换算成市值相当于增加了约1500亿美元,合人民币超1万亿。
让AI推荐一款家用车、一款新手机,甚至一家本地餐厅,10秒钟,看起来无所不知的AI就能迅速给出“智能推荐”名单。然而这份看起来客观中立的答案,背后可能早已被“精心策划”过。
REG 是一种简单而有效的方法,仅通过引入一个 class token 便能大幅加速生成模型的训练收敛。其将基础视觉模型(如 DINOv2)的 class token 与 latent 在空间维度拼接后共同加噪训练,从而显著提升 Diffusion 的收敛速度与性能上限。在 ImageNet 256×256 上,
深圳的冬天依然晴朗无云。站在 2025 IDEA 大会的会场,我今年最大的感受是大会现场有关「AGI 焦虑」变少了,对 AI 落地的「颗粒度」变细了。与去年相比,人们不再讨论 AGI 到底什么时候到来,不再充斥着对参数规模的盲目崇拜,而是更关注如何让 AI 带来更多的价值。
大无语事件天天有,今天特别多——AI大模型公司阶跃星辰的研究员,自曝被苹果挂在arXiv上的论文,狠狠坑了一把。自己去反馈问题,对方简单回了两句就把issue关了;直到自己留下公开评论,对方才撤稿下架代码了。
“爸,门口有个流浪汉,说认识你。”Joe给正在上班的父亲发去一张图片,是一个胡子拉碴的陌生男人站在门口,父亲称并不认识这个人,“他想做什么?”“他说你们俩曾经一起上学,我请他进来了。”之后,Joe又陆续给父亲发去了这个貌似流浪汉的陌生人在翻家里的冰箱、用父亲的牙刷刷牙、甚至在父亲床上睡觉的图片……
人工智能在过去的十年中,以惊人的速度革新了信息处理和内容生成的方式。然而,无论是大语言模型(LLM)本体,还是基于检索增强生成(RAG)的系统,在实际应用中都暴露出了一个深层的局限性:缺乏跨越时间的、可演化的、个性化的“记忆”。它们擅长瞬时推理,却难以实现持续积累经验、反思历史、乃至真正像人一样成长的目标。
窗外是极端天气,看上去不适合出门。房间内点着一团噼啪作响的篝火,角落里还有充足的物资来捱过这个冬天……这里看起来像是世界末日场景下的庇护所,在每天晚上,你都能在抖音和B站的直播间内找到这些由AI生成的安全屋实景视频,它们正陪伴着很多人,度过一个又一个不眠之夜。
“星巴克内部正在计划,希望在三年内为所有员工配备一个‘数字员工助手’,可能不止一个。有了这样的助手,我们会有更多的时间思考和创新,这些是 AI 永远也给不了的。”