李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了
李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含 300 万个数字的数据集(1000×1000×3 个颜色通道)。每个数字代表一个像素点的颜色深浅,从 0 到 255。
当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含 300 万个数字的数据集(1000×1000×3 个颜色通道)。每个数字代表一个像素点的颜色深浅,从 0 到 255。
DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。
DeepSeek 开源周的第三天,带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1 的训练和推理提供强大支持,在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。
上半场电动化,下半场智能化。智驾不再是遥不可及的稀罕之物。昨晚,比亚迪在深圳总部重磅发布了全民智驾战略。在整车智能战略下,比亚迪构建的「天神之眼」技术矩阵让高阶智驾技术覆盖了全系车型。
当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”?
在CES上老黄透露,AI智能体未来价值达数万亿,我们早已迎头赶上!昨天,中国AI国家队讯飞重磅升级了办公智能体矩阵,PPT、短视频、公文写作、会议纪要、投标方案一网打尽。从此,这支永不疲倦的「AI员工天团」将彻底改变你的工作方式。
公司的核心目标就是打造一个集多模态技术、高效推理、可信赖与情感交互于一体的“AI导师”。
基于昇腾算力的矩阵运算改进求解器框架,大幅提升Local Optimum跳出能力。
近日,95后初创公司AID Lab团队宣布完成了数百万天使+轮融资,本轮融资由室内设计领域头部上市公司矩阵纵横(矩阵股份:301365)领投。
在现代 AI 模型的快速迭代中,如何在保持模型精度的同时提升计算效率成为关键课题。尤其在大规模 AI 推理中,非结构化稀疏矩阵的计算效率低下成为难以突破的瓶颈。面对这一挑战,我们自主研发了 CROSS—— 一种创新的端到端稀疏编译优化方案,为 AI 推理带来细粒度稀疏计算的加速效果。