
无损加速视觉语言模型推理!轻松剪掉视觉冗余Token|腾讯AI Lab
无损加速视觉语言模型推理!轻松剪掉视觉冗余Token|腾讯AI Lab多图像、长视频、细粒度感知正在让大型视觉语言模型(LVLM)变得越来越聪明,但也越来越“吃不消”:视觉Token数量的激增所带来的推理成本暴涨,正逐渐成为多模态智能扩展的最大算力瓶颈。
多图像、长视频、细粒度感知正在让大型视觉语言模型(LVLM)变得越来越聪明,但也越来越“吃不消”:视觉Token数量的激增所带来的推理成本暴涨,正逐渐成为多模态智能扩展的最大算力瓶颈。
就在今天,腾讯元器(智能体平台)悄悄上线了微信支付MCP
6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官网正式上线,支持快速接入部署。
总是“死记硬背”“知其然不知其所以然”?
现有的语言大模型(LLMs)在复杂指令下的理解和执行能力仍需提升。
据了解,宇树科技已于近期完成了去年底开启的 C 轮融资,由中国移动旗下基金、腾讯、锦秋、阿里、蚂蚁和吉利资本共同领投,宇树的大部分老股东跟投。宇树投前估值目前超过 100 亿元人民币。
6 月 16 日,腾讯 AI Lab 推出并开源 SongGeneration 音乐生成大模型,专注解决音乐 AIGC 中音质、音乐性与生成速度这三大共性难题
AI独角兽稀宇科技(MiniMax)正考虑在香港进行首次公开募股(IPO)。
微信和游戏业务正在为腾讯AI应用战略的实施提供更广阔的战略纵深。抓住DeepSeek带来的契机扭转AI领域的竞争态势之后,腾讯围绕AI应用的布局正在快速深化。
2025 年,多模态生成是一个好方向吗?」这是一位同学在今年年初提出的问题。