专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能
专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能在 AI 领域,近年来各个子领域都逐渐向 transformer 架构靠拢,只有文生图和文生视频一直以 diffusion + u-net 结构作为主流方向。diffusion 有更公开可用的开源模型,消耗的计算资源也更少。
搜索
在 AI 领域,近年来各个子领域都逐渐向 transformer 架构靠拢,只有文生图和文生视频一直以 diffusion + u-net 结构作为主流方向。diffusion 有更公开可用的开源模型,消耗的计算资源也更少。
进入现今的大模型 (LLM) 时代,又有研究者发现了左右互搏的精妙用法!近日,加利福尼亚大学洛杉矶分校的顾全全团队提出了一种新方法 SPIN(Self-Play Fine-Tuning),可不使用额外微调数据,仅靠自我博弈就能大幅提升 LLM 的能力。
这篇论文介绍了一项新的任务 —— 指向性遥感图像分割(RRSIS),以及一种新的方法 —— 旋转多尺度交互网络(RMSIN)。
iPhone迎来AI时刻?岁末年初,苹果加快了在大模型领域的步伐。
几乎是和斯坦福“炒虾洗碗”机器人同一时间,谷歌DeepMind也发布了最新具身智能成果。
大模型元年里,哪怕是跑在趋势最前沿的基座模型厂商,都难逃算力焦虑。
自从一年多之前,OpenAI推出ChatGPT之后,科技行业掀起了一股生成式AI热潮,谷歌、微软、Meta等诸多巨头快速跟进,纷纷推出了各自的大模型和具体应用:加入生成式AI功能,带来全新的产品体验。
Frank原本做的是一个直接面向消费者的人工智能产品。2023年3月,他带着这个想法在奇绩创坛的上海办公室里见到了陆奇。陆奇曾就职于微软,是硅谷地位最高的华人高管,现在专注于创业孵化。
ChatGPT-3.5 发布于 2023 年 3 月 1 日,短短一年内,AI 已经变成几乎所有科技公司都关注的话题,并且涌现了不少大模型。
起底大模型捧红的23家独角兽,大语言模型、垂直行业应用狂吸金。生成式AI这把火在资本市场越烧越旺。