
小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑
小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑检索增强生成(RAG)虽好,但一直面临着资源消耗大、部署复杂等技术壁垒。近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。
检索增强生成(RAG)虽好,但一直面临着资源消耗大、部署复杂等技术壁垒。近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。
「星际之门」更多内幕被曝光了!据称,首期投入1000亿美金,将在德州阿比林建设10座数据中心,未来要在全美打造20个超算。与此同时,奥特曼秀出了首期工厂的全景,无比震撼。
从预定到交付,一款AI眼镜需要的时间可能比新能源汽车还要久。这种产品交付时间的反差性,来自AI眼镜赛道的新势力闪极。有网友戏谑称:“5月底预定的闪极拍拍镜还没发货,但是同期预定的小米汽车早就开上了,期待小米官方早日重启AI眼镜产品线,把中小厂的交付速度卷起来。”
谁是Luca Rossi?他的官方职位是“联想集团执行副总裁兼智能设备业务集团(IDG)总裁”,换成直白一点的形容,Luca管理着联想旗下几乎所有消费级终端产品——包括PC、智能手机、平板电脑等等。
AI硬件能孕育出新的巨头吗2025年初,在AI大模型和AI应用热潮之后,消费级AI硬件也开始逐步受到市场和资本的关注,除了手机和PC外,AI也确实正在改变消费电子产品的外延和形态。截至目前,我们统计至少已有117家公司入局了AI硬件。这些硬件产品主要集中在眼镜、耳机、教育、陪伴、助理和健康六大领域,其中有超7成为中国公司,除中国之外,美、日、韩、印、以色列企业均有参与。
DeepSeek-R1,正在接受全球网友真金白银的检验。花30秒用manim代码制作解释勾股定理的动画,一次完成无错误。为了玩上这样的模型,有人花上10多万元,组7台M4 Pro Mac mini+1台M4 Max Macbook Pro的家用超算。
人类仅剩2-3年时间了!Anthropic首席执行官Dario Amodei独家采访,一口气爆料一连串AI重磅消息,并在最后给出了对于职场年轻人的建议。
北京大学信息工程学院田永鸿教授、陈杰副教授,联合广州国家实验室周鹏研究员指导博士生聂志伟、硕士生刘旭东等,提出了一种进化驱动的病毒变异驱动力预测框架 E2VD,可以对新冠病毒、流感病毒、寨卡病毒、艾滋病病毒进行预测。
AI生图热潮下,技术与艺术正在不断碰撞中擦出新火花。人们对于生成效果和创意的要求都在悄然提升,同时也开始更加注重其中的实用性与持续性,而非只是单纯的娱乐体验。
2025年AI半导体需求旺盛,EV需求低迷。