基于剧本杀场景的文本特征抽取方法、系统、设备及介质
申请号:CN202411883531
申请日期:2024-12-19
公开号:CN119808758A
公开日期:2025-04-11
类型:发明专利
摘要
本公开实施例中提供了一种基于剧本杀场景的文本特征抽取方法、系统、设备及介质,属于数据处理技术领域,具体包括:步骤1,获取剧本杀样本数据集中的文本段落,通过基于剧本杀文本格式的预处理方法对文本文段进行数据处理操作,得到重排序后的文本序列;步骤2,将文本序列输入特征提取网络,得到特征表示;步骤3,根据特征表示和文本序列对应的标签代入N‑pairs损失函数训练特征提取网络;步骤4,对目标文本进行数据处理操作后输入训练好的特征提取网络,得到特征抽取结果。通过本公开的方案,提高了处理效率、精准度和适应性。
技术关键词
特征提取网络
特征抽取方法
文本段落
序列
前馈神经网络
特征抽取系统
噪声数据
多头注意力机制
场景
样本
模块
主题模型
数据处理技术
计算机
处理器
语义
矩阵