基于词元概率统计的大模型生成中文文本检测方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于词元概率统计的大模型生成中文文本检测方法及系统
申请号:CN202510916116
申请日期:2025-07-03
公开号:CN120822515A
公开日期:2025-10-21
类型:发明专利
摘要
本发明公开了一种基于词元概率统计的大模型生成中文文本检测方法及系统。本发明首先调用代理大语言模型对目标文本进行推理,获取其每个token的对数概率,然后基于目标文本的token对数概率序列,分别计算全局统计量与局部统计量;最后将全局统计量与局部统计量相除作为目标文本的检测得分,将检测得分与给定的阈值相比较进而做出决策。本发明将目标文本的token对数概率序列的全局与局部统计量相结合,实现了低成本、高性能的大语言模型生成文本检测。相比于现有的仅利用了全局统计量的检测方法,本文在跨模型、跨领域等复杂场景下均实现了更高的检测精度。
技术关键词
中文文本 序列 算术平均值 调用代理模型 计算机电子设备 Softmax函数 滑动窗口 存储计算机程序 大语言模型 计算机程序产品 分词 处理器 存储器 高性能 低成本 模块 指令 决策 场景