用于根据文本提示生成合成视频数据的方法和设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
用于根据文本提示生成合成视频数据的方法和设备
申请号:
CN202510310990
申请日期:
2025-03-17
公开号:
CN120676111A
公开日期:
2025-09-19
类型:
发明专利
摘要
本发明涉及一种用于根据文本提示生成合成视频数据的方法,特别是用于提供用于训练和/或测试和/或验证和/或确认机器学习模型的视频数据,该方法包括:‑提供(S1)描述要生成的视频数据的内容的输入文本提示;‑通过大语言模型将所提供的文本提示分解(S2)为至少两个文本子提示;‑为至少两个文本子提示中的每一个生成(S3)文本嵌入;以及‑基于所生成的文本嵌入,通过视频扩散模型生成(S4)合成视频数据。
技术关键词
注意力
文本
视频
机器学习模型
大语言模型
数据
变换器
图像编码器
视觉特征
计算机
因子
动态
介质
网络
模式