
一张图,快速生成可拆分3D角色!腾讯清华新SOTA | CVPR 2025
一张图,快速生成可拆分3D角色!腾讯清华新SOTA | CVPR 2025任意一张立绘,就可以生成可拆分3D角色!
任意一张立绘,就可以生成可拆分3D角色!
就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍,新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练,能更好地捕获语音细微差别,减少误识别,大幅提升转录可靠性。
前脚被谷歌点名感谢空间训练平台,后脚又开源了空间模型!杭州六小龙群核科技发了一个空间理解开源模型SpatialLM,让机器人刷一段视频,就能理解物理世界的几何关系。结合之前发布的空间智能训练平台SpatialVerse,群核科技要为机器人提供从空间认知到行动交互的训练闭环。机器人也被「卷」到要上学了。
3D打印的世界在不断变化,人工智能(AI)的发展发挥着越来越重要的作用。特别是,通过人工智能生成3D模型开辟了新的可能性和潜力。在本文中,将介绍22种创新服务,它们在这一领域发挥着开创性的作用。
当我们看到一张猫咪照片时,大脑自然就能识别「这是一只猫」。但对计算机来说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个包含 300 万个数字的数据集(1000×1000×3 个颜色通道)。每个数字代表一个像素点的颜色深浅,从 0 到 255。
阿里全面转向“AI化”
最近在推特上刷到一条视频,特别火爆,彻底把我看呆了。
AI能为乙游玩家带来什么?
Stability AI 发布了一款新 AI 模型——Stable Virtual Camera,该公司宣称该模型能将 2D 图像转化为,具有真实深度和视角的“沉浸式”视频。
终于到了适合跟大家介绍大模型的万能接口 MCP(Model Context Protocol)的时候了!