
80G显存塞50个7B大模型!清华&OpenBMB开源增量压缩新算法,显存节省8倍
80G显存塞50个7B大模型!清华&OpenBMB开源增量压缩新算法,显存节省8倍最新模型增量压缩技术,一个80G的A100 GPU能够轻松加载多达50个7B模型,节省显存约8倍,同时模型性能几乎与压缩前的微调模型相当。
最新模型增量压缩技术,一个80G的A100 GPU能够轻松加载多达50个7B模型,节省显存约8倍,同时模型性能几乎与压缩前的微调模型相当。
11月27日消息,钛媒体App独家获悉,360集团(SHA: 601360)研发的全新生成式 AI 搜索产品“纳米搜索” App日前已上架到苹果App Store和应用宝等安卓应用商店,直接对标百度、阿里夸克、秘塔AI、Perplexity AI等多个 AI 搜索类产品。
11月27日,猎户星空联合聚云科技举办了题为《Data Ready for Al,MoE大模型发布暨商业闭环分享》媒体见面会。猎户星空正式发布了自主研发的Orion-MoE 8×7B大模型,并携手聚云科技推出了基于该大模型的数据服务—AI数据宝AirDS(AI-Ready Data Service)。
只要改一行代码,就能让大模型训练效率提升至1.47倍。
什么?Scaling Law最早是百度2017年提的?! Meta研究员翻出经典论文: 大多数人可能不知道,Scaling law原始研究来自2017年的百度,而非三年后(2020年)的OpenAI。
据国外网站分析工具Similarweb显示,在同期AI视频产品中,可灵流量增长十分迅速。截至9月24日,可灵的总访问量达到了3370万,高于早已发布产品的Runway(3134万)和Pika(752万)。
在 10 月 AI 产品榜全球访问量 Top100 榜单中,出现了一款之前没见过的产品 Submagic,该产品位列第 56,本月访问量达到 1262W,环比增幅达 119.87%。在最近已经有些固化、很少出现新产品的 AI 榜单,实属难得。
今天我们就来看看AI搜索赛道为什么能跑出估值超600亿的独角兽?
让照片会“唱歌”,让人脸会“跳舞”。近期,一款名为Revive的AI图像应用登上欧洲多地娱乐免费榜Top50。上线两年左右的时间里,积累了近1700万用户,收入量也是高达1162万美元。
Meta全新发布的基准Multi-IF涵盖八种语言、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于英语。