基于上下文扩展的人机混合文本检测方法

申请号：CN202510508917

申请日期：2025-04-22

公开号：CN120409492A

公开日期：2025-08-01

类型：发明专利

摘要

本发明涉及一种基于上下文扩展的人机混合文本检测方法，通过引入滑动窗口机制，将检测范围从单个目标句子扩展到该句子的上下文，并设计减弱上下文噪声干扰的方法，提高模型预测的准确性和泛化性。首先，采集窗口长度大小的文本作为训练集和验证集，提取语义特征和连贯性特征进行训练，得到训练好的检测模型。在测试集上应用滑动窗口机制对所有的窗口文本进行检测，设置较小的滑动窗口步长，则窗口文本中的句子会获得多个在不同上下文情况下的预测概率。采取基于置信度的检测机制，对多个预测概率进行置信度加权，获取该句子为AI文本的最终概率。

技术关键词

文本检测方法序列滑动窗口机制人机分类网络大语言模型训练特征滑动窗口方法语义特征提取文章分类器语法结构信息编码矩阵标记标识

系统为您推荐了相关专利信息

一种保证程序间数据传输过程中信息安全的方法

非对称加密算法 LED灯珠真实性验证密钥标记

一种基于全局-局部特征融合的大模型幻觉文本检测方法

文本检测方法卷积模块特征提取模型多头注意力机制压缩特征

基于轻量卷积神经网络的高效时间序列分析方法、装置及介质

轻量卷积神经网络时间序列分析方法分析组件滤波器非线性

基于无人机的集中式光伏电站的智能巡检系统

光伏组件图像感兴趣区域图像集中式光伏电站智能巡检系统区域特征提取