一种基于阅读理解的违规数据检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于阅读理解的违规数据检测方法
申请号:CN202411946843
申请日期:2024-12-26
公开号:CN119884368B
公开日期:2025-09-23
类型:发明专利
摘要
本发明公开了一种基于阅读理解的违规数据检测方法,涉及自然语言处理和人工智能技术领域。包括:获取包含仇恨言论的多模态数据,多模态数据包括语音数据和文本数据;利用语音识别系统将语音数据转换为文本数据,得到文本内容;利用大语言模型的思维链提示生成文本内容的逐步推理解释,根据文本内容的逐步推理解释得到初步预测类别标签;基于得到的文本内容的逐步推理解释,再次利用大语言模型生成最终预测类别标签;根据最终预测类别标签生成训练数据;利用训练数据对违规文本分类模型进行训练,得到训练后的检测结果。本发明显著提高了对隐晦、复杂违规言论的检测准确性。
技术关键词
数据检测方法 大语言模型 生成文本内容 预测类别 文本分类模型 语音识别系统 自然语言模型 生成训练数据 标签 社交媒体平台 多模态 爬虫技术 人工智能技术 框架 对象 优化器
系统为您推荐了相关专利信息
语言模型构建方法 数据 语句 文本 模型构建装置
数据检测方法 数据检测电路 错误纠正码 数据运行系统 控制模块
记忆 人机交互方法 大语言模型 多维对象 精度
关键词 AC自动机 匹配模块 文本分类模型 词语