一种数据集获取方法、装置、设备及可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种数据集获取方法、装置、设备及可读存储介质
申请号:CN202411379901
申请日期:2024-09-30
公开号:CN119248961A
公开日期:2025-01-03
类型:发明专利
摘要
本申请公开了一种数据集获取方法、装置、设备及可读存储介质,该方法包括:获取视频集,并对视频集中的视频标注文本;删除视频集中视频内容符合删除条件的视频,得到第一视频集;计算第一视频集中视频与其标注文本的关联性分值;基于关联性分值,删除第一视频集中文本标注不准确的视频,得到第二视频集;将第二视频集中的视频,按照视频生成模型的样本数据格式进行保存。本申请技术效果:通过对视频集的视频进行多角度的清洗,从而获取到高质量用于训练视频生成模型的数据集。
技术关键词
数据集获取方法 视频生成模型 数据格式 关键帧 文本 标志 图像 样本 场景 可读存储介质 存储计算机程序 关键词 面部 单人 分析模块 定位框 多角度 处理器