面向生成式大模型的文本同源性分析方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向生成式大模型的文本同源性分析方法
申请号:CN202510008588
申请日期:2025-01-03
公开号:CN119940368A
公开日期:2025-05-06
类型:发明专利
摘要
本发明涉及文本数据分析技术领域,尤其涉及一种面向生成式大模型的文本同源性分析方法,包括以下步骤:S1:对面向生成式大模型的文本数据进行预处理后,将文本数据转化为高维语义嵌入向量,引入混合距离度量进行相似度分析;S2:采用基于密度峰值的动态聚类算法进行动态聚类分析,生成初步的同源文本簇,引入多重迭代映射与动态梯度扰动机制进一步分析,得到优化的同源文本簇;S3:将优化的同源文本簇进行多模态融合,利用图结构对融合后的多模态同源文本簇进行分析,应用时间序列分析方法,得到文本的同源性分析与来源追踪结果,本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性,增强了文本表示的鲁棒性和准确性。
技术关键词
同源性分析方法 文本 语义 时间序列分析方法 混沌系统 非线性 动态 机制 度量 多模态 数据嵌入 节点 聚类算法 重构 词向量模型 数据分析技术 控制权 关系 高斯核函数