AI资讯新闻榜单内容搜索-3D

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3D
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。

来自主题: AI技术研报
4587 点击    2023-12-17 19:41
GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT 4.5疑似大泄漏: 一个是新模型将具备全新多模态能力,文本语音图片以及视频和3D信息全都能一并处理,并且还可以跨模态理解。

来自主题: AI技术研报
7550 点击    2023-12-15 18:57
2023年度十大前沿科技趋势发布:6大赛道10项技术,智能体和3D生成正引爆AI,空间计算开启终端变革、端到端自动驾驶成共识

2023年度十大前沿科技趋势发布:6大赛道10项技术,智能体和3D生成正引爆AI,空间计算开启终端变革、端到端自动驾驶成共识

2023年度十大前沿科技趋势发布:6大赛道10项技术,智能体和3D生成正引爆AI,空间计算开启终端变革、端到端自动驾驶成共识

区别于其他智库和研究机构,量子位智库基于量子位长期以来对AI及其他前沿科技的追踪报道,积累了数年对前沿科技的深入洞察。

来自主题: AI资讯
4972 点击    2023-12-15 18:41
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力

随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力

随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力

本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后,Alpha-CLIP可以在保证CLIP原始感知能力的前提下,关注到任意指定区域。通过替换原始CLIP的应用场景,Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。

来自主题: AI资讯
7944 点击    2023-12-13 16:14
HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架

HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架

HumanGaussian开源:基于Gaussian Splatting,高质量 3D 人体生成新框架

在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。

来自主题: AI技术研报
6969 点击    2023-12-10 14:27
矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见

Transformer大模型工作原理究竟是什么样的?一位软件工程师打开了大模型的矩阵世界。黑客帝国中,「矩阵模拟」的世界或许真的存在。

来自主题: AI资讯
7584 点击    2023-12-04 18:48
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法

单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法

单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法

3D 生成是 AI 视觉领域的研究热点之一。本文中,来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型重建模型来对多视图扩散进行去噪,并提出了一种新颖的 3D 生成方法 DMV3D,实现了新的 SOTA 结果。

来自主题: AI技术研报
7149 点击    2023-11-28 10:35