多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注
多图场景用DPO对齐!上海AI实验室等提出新方法,无需人工标注多图像场景也能用DPO方法来对齐了! 由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。 这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。
多图像场景也能用DPO方法来对齐了! 由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。 这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。
现在,一个大模型就能直接拿来当游戏,还是开放世界的那种! 可以直接根据玩家操作预测下一帧,连游戏引擎都省了。 这个怎么看都像是《我的世界》的界面,就是这款游戏Oasis本尊了。
虽然有些人认为人工智能是种威胁,但美国军方却将其视为探测威胁的工具。美国防部近期在肯塔基州蓝草陆军仓库(BGAD)部署了一套由安防初创公司Scylla开发的人工智能监控系统,以提升军事设施的安保能力。该系统在为期八个月的测试中展现出卓越的性能,将为美国核设施安全带来革命性变革。
就在刚刚,CEO奥特曼携4大高管集体亮相reddit有问必答活动(AMA ),挨个回复了大家对OpenAI主要产品、AGI路线规划等提问。
人在知乎,正经搞科研,这事儿越来越有谱了(doge)。 想了解下学术热点,直接一搜,AI不仅一步到位给出总结,连参考文献都列好了。
临近年关,打算开个新系列,从总结视角聊聊AI领域的新趋势,顺便填坑。第一篇先聚焦产品形态的变化。
探索更高效的模型架构, MoE是最具代表性的方向之一。 MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干功能模块,每次计算仅激活其中一小部分,而保持其余模块不被使用,从而大大降低了模型的计算与学习成本,能够在同等计算量的情况下产生性能优势。
专注金融领域的AI Agent平台Interface.ai宣布完成3000万美元首次融资,由Avataar Venture Partners领投。
本文介绍了一种自动化故事可视化系统,可以生成多样化、高质量、一致性强的故事图像,且需要最少的人工干预。
今天 ChatGPT 的搜索功能发布了,或许是已经用 Perplexity 比较习惯,此次 ChatGPT 的搜索就没太多惊艳感了,所以我体验了一下感觉效果一般般,看看后续多用用会不会有更多不一定的体验。