
线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署
线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署香港大学联合上海人工智能实验室,华为诺亚方舟实验室提出高效扩散模型 LiT:探索了扩散模型中极简线性注意力的架构设计和训练策略。LiT-0.6B 可以在断网状态,离线部署在 Windows 笔记本电脑上,遵循用户指令快速生成 1K 分辨率逼真图片。
香港大学联合上海人工智能实验室,华为诺亚方舟实验室提出高效扩散模型 LiT:探索了扩散模型中极简线性注意力的架构设计和训练策略。LiT-0.6B 可以在断网状态,离线部署在 Windows 笔记本电脑上,遵循用户指令快速生成 1K 分辨率逼真图片。
检索增强生成(RAG)虽好,但一直面临着资源消耗大、部署复杂等技术壁垒。近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。
论文一作刘少腾,Adobe Research实习生,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是多模态大模型和生成模型,包含图像视频的生成、理解与编辑。作者Tianyu Wang、Soo Ye Kim等均为Adobe Research Scientist。
近日,珞博智能(Robopoet)官方发布一则消息,前字节大模型解决方案架构师潘雨楠(Yuna)正式加入珞博,出任联合创始人兼首席技术官(CTO)。潘雨楠本科毕业于哈尔滨工业大学,又在香港大学取得计算机专业硕士学位,她的学术背景为其在科技领域的发展奠定了坚实基础。
随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。
2023年初,跨国工程公司Arup香港分公司的一位员工,收到了一封会议邮件。邮件邀请他参加一次由总部高管发起的重要会议。
12 月 22 日消息,据《南华早报》今日报道,香港中文大学(CUHK)的研究人员开发了一种新的基础人工智能模型,能够帮助解决眼科临床任务,特别是在疾病筛查和诊断方面。随着生成式 AI 在医学领域的应用逐步增多,这一技术有望带来更广泛的影响。
近日,阿里巴巴创业者基金宣布成立人工智能基金,规模为1.5亿美元。该基金主要覆盖人工智能可以深度应用的行业,包括金融服务、消费零售、医疗保健、建筑和房地产以及艺术和娱乐等。
本文中,香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中,通过将不同类别和数量的输入/输出图像建模为视频帧,从大规模真实视频数据中学习属性、姿态、光照等多种变化规律,从而实现高保真的生成效果。
讯飞医疗的拆分上市,终于有了新的进展。 港交所文件显示,12月12日,讯飞医疗科技股份有限公司通过港交所上市聆讯。该公司今年7月提交上市申请,华泰国际、广发证券(香港)、建银国际为联席保荐人。