从「最强2D」升维「最强3D」!智源联合清北重磅发布10亿参数Uni3D视觉大模型
从「最强2D」升维「最强3D」!智源联合清北重磅发布10亿参数Uni3D视觉大模型最近,智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D,在主流3D视觉能力上取得了全方位的性能突出!
来自主题: AI技术研报
3980 点击 2023-10-21 14:12
最近,智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D,在主流3D视觉能力上取得了全方位的性能突出!
联发科今日宣布与 vivo 在 AI 领域深度合作和联调,率先实现了 10 亿和 70 亿 AI 大语言模型以及 10 亿 AI 视觉大模型在手机端侧的落地
著名计算机科学家Andrew Ng在近期的AI硬件峰会上宣称:“我们在文本领域所见到的革命将会出现在图像领域。”
Storia号称“以100倍的速度和更便宜的方式预先可视化您的故事”,通俗来说就是帮助电影制作人、营销人员和其他故事讲述者把“文本”转换为视觉效果。
FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。
昨晚,昆仑万维突然发文官宣:计算机视觉和机器学习领域国际顶级专家颜水成教授正式加盟!
在快速发展的人工智能领域,自然语言处理已成为研究人员和开发人员关注的焦点。近年来,在Transformer 架构和BERT 双向升级的基础上,出现了几种突破性的语言模型,突破了机器理解和生成的界限。
尽管好莱坞正卷入涉及人工智能的持续劳工争议,但这项技术早在很久以前就已经渗透到电影和电视领域。在洛杉矶举行的SIGGRAPH大会上,算法和生成工具在无数的演讲和公告中得到了展示。