VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案
VLM剪枝新SOTA:无需重训练,注意力去偏置超越6大主流方案近年来,Vision-Language Models(视觉—语言模型)在多模态理解任务中取得了显著进展,并逐渐成为通用人工智能的重要技术路线。
近年来,Vision-Language Models(视觉—语言模型)在多模态理解任务中取得了显著进展,并逐渐成为通用人工智能的重要技术路线。
国产算力基建跑了这么多年,大家最关心的逻辑一直没变:芯片够不够多?但对开发者来说,真正扎心的问题其实是:好不好使?
当 AI 开始 「社牛」,我们该笑还是该怕? 作者|桦林舞王 编辑|靖宇 就在全网还在沉浸 Moltbot 给人们带来的,让「AI 做牛马」的快感的时候,事情,有点不对了。 过去 72 小时,一个名为
深夜在房间里想回消息,又怕键盘声吵到睡着的家人; 开会时想用语音快速记录,结果被识别准确率搞得想摔手机; 打游戏时想和队友快速沟通,输入法却永远猜不中你的意思…… 这些看似小的问题,累积起来足够让人抓
继OpenAI大神姚顺雨之后,腾讯AI再添猛将!95后清华「天骄」庞天宇,正式入职腾讯,出任混元首席研究科学家,负责多模态强化学习。腾讯的大模型「梦之队」版图,正在极速扩张。
松鼠Ai创始人栗浩洋在达沃斯论坛展示了一条教育普惠新路径:AI把名师课程成本削减百倍,让优质教育触手可及。松鼠Ai已服务6万所公立学校,在全国开设3000多家AI自习室,创下吉尼斯教学实效纪录。这证明技术既能提升效率,更能填平教育鸿沟。
在 AI 上日渐落后的苹果,最近几个月加紧了前进步伐。抛弃 OpenAI,携手 Google Gemini 后,苹果近日又有新动作。当地时间 1 月 29 日,苹果公司完成了一项近 20 亿美元的收购,目标是以色列 AI 初创公司 Q.ai。
离开Meta这座围城后,Yann LeCun似乎悟了“不要把鸡蛋装在同一个篮子里”。一边,他亲手打造了自己的初创公司AMI,试图在世界模型这条赛道上大展拳脚;同时,他的目光又投向了硅谷的另一角。
大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。
AI 需要整个互联网来学习,而人类只需要一个童年。人类在成年之前,所接触的语言、文本与符号,顶多只有几十亿 token,相差几个数量级。正是从这个问题出发,一家几乎没有产品、没有盈利、也不急于商业化的 AI 创业公司,从 GV、Sequoia 和 Index 拿到了 1.8 亿美元融资,并获得了 Andrej Karpathy 的公开力挺。