一种数据集获取方法、装置、设备及可读存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种数据集获取方法、装置、设备及可读存储介质
申请号:
CN202411379901
申请日期:
2024-09-30
公开号:
CN119248961A
公开日期:
2025-01-03
类型:
发明专利
摘要
本申请公开了一种数据集获取方法、装置、设备及可读存储介质,该方法包括:获取视频集,并对视频集中的视频标注文本;删除视频集中视频内容符合删除条件的视频,得到第一视频集;计算第一视频集中视频与其标注文本的关联性分值;基于关联性分值,删除第一视频集中文本标注不准确的视频,得到第二视频集;将第二视频集中的视频,按照视频生成模型的样本数据格式进行保存。本申请技术效果:通过对视频集的视频进行多角度的清洗,从而获取到高质量用于训练视频生成模型的数据集。
技术关键词
数据集获取方法
视频生成模型
数据格式
关键帧
文本
标志
图像
样本
场景
可读存储介质
存储计算机程序
关键词
面部
单人
分析模块
定位框
多角度
处理器