NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²
NeurIPS 2023|有效提高视频编辑一致性,美图&国科大提出基于文生图模型新方法EI²美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。
搜索
美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。
多模态技术是 AI 多样化场景应用的重要基础,多模态大模型(MLLM)展现出了优秀的多模态信息理解和推理能力,正成为人工智能研究的前沿热点。上周,谷歌发布 AI 大模型 Gemini,据称其性能在多模态任务上已全面超越 OpenAI 的 GPT-4V,再次引发行业的广泛关注和热议。
在大模型热潮中,一直保持低调的字节跳动,日前也被曝出了“套壳“的瓜。
软件开发人员对代码生成 AI 已经不陌生,它们已经成为提高生产力的利器。本文中,伊利诺伊大学香槟分校(UIUC)张令明老师团队带来了代码生成 AI 领域的又一力作 ——Magicoder,在短短一周之内狂揽 1200 多颗 GitHub Star,登上 GitHub Trending 日榜,并获推特大佬 AK(@_akhaliq)发推力荐。
ChatGPT发布一年后,围绕生成式AI的热潮已经席卷科技企业,手机、PC厂商都在争先将AI融入产品中,由此,也让新一轮的设备硬件内卷序幕,被快速拉开。
本文从计算模式的视角探讨了大模型公司的兴衰起伏。作者认为,计算的分布是基础硬件的抽象方式,而大模型公司会在通用计算平台上开发自己的应用,以获取更大的收益。未来的计算模式可能会围绕人工智能展开,而大模型公司需要在端上掌握计算的生态控制力。
最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。
用扩散模型预测化学反应,速度直接暴涨1000倍!原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。
多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。
12月15日,上海交通大学医学院附属瑞金医院正式发布瑞金医学大模型矩阵,涵盖RJH-Base基座大模型、RJH-Med应用大模型,以及多模态大模型,并携手上海人工智能实验室、腾讯等建设可持续发展的医学大模型应用生态,实践以数据、知识、算法、模型为关键驱动的医学AI新范式。