一种基于CRF模型的智能数据打标方法、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于CRF模型的智能数据打标方法、设备及介质
申请号:CN202410749355
申请日期:2024-06-11
公开号:CN118861880A
公开日期:2024-10-29
类型:发明专利
摘要
本发明涉及数据处理技术领域,公开了一种基于CRF模型的智能数据打标方法、设备及介质,包括:采集文本数据、语音数据及图像数据;将语音数据转换为目标文本数据,识别文本数据及目标文本数据中的不符合预设规则的内容;对不符合预设规则的内容进行词性标注处理,得到语义标注数据,以及提取图像数据对应的图像特征;将语义标注数据及图像特征合并为数据标注集,根据标注任务需求对CRF模型中的状态特征及转移特征进行特征调整,利用数据标注集对调整后的CRF模型进行参数优化;利用优化后的CRF模型对待标注数据进行打标,得到待标注数据对应的标注类型。本发明可以提高数据打标时的准确性。
技术关键词
数据打标方法 CRF模型 图像标识符 文本 语义 情感类别 分词 词语 样本 语音特征 数据验证 处理器 数据处理技术 关键词 估计算法 参数