面向生成式大模型的文本同源性分析方法

申请号：CN202510008588

申请日期：2025-01-03

公开号：CN119940368A

公开日期：2025-05-06

类型：发明专利

摘要

本发明涉及文本数据分析技术领域，尤其涉及一种面向生成式大模型的文本同源性分析方法，包括以下步骤：S1：对面向生成式大模型的文本数据进行预处理后，将文本数据转化为高维语义嵌入向量，引入混合距离度量进行相似度分析；S2：采用基于密度峰值的动态聚类算法进行动态聚类分析，生成初步的同源文本簇，引入多重迭代映射与动态梯度扰动机制进一步分析，得到优化的同源文本簇；S3：将优化的同源文本簇进行多模态融合，利用图结构对融合后的多模态同源文本簇进行分析，应用时间序列分析方法，得到文本的同源性分析与来源追踪结果，本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性，增强了文本表示的鲁棒性和准确性。

技术关键词

同源性分析方法文本语义时间序列分析方法混沌系统非线性动态机制度量多模态数据嵌入节点聚类算法重构词向量模型数据分析技术控制权关系高斯核函数