文本去重方法及相关装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
文本去重方法及相关装置
申请号:
CN202510618518
申请日期:
2025-05-14
公开号:
CN120144548B
公开日期:
2025-09-12
类型:
发明专利
摘要
本申请公开了一种文本去重方法及相关装置。该文本去重方法包括:分别对当前源计算节点中的各文本进行一次编码,得到各文本的文本编码值;将各文本的文本编码值划分为若干类编码集合,其中,同一类编码集合内各文本编码值之间的相似度,高于不同类编码集合间不同文本编码值的相似度;针对各类编码集合,对当前源计算节点中编码集合对应的文本进行去重,其中,需去重的文本是基于需去重的文本与所在编码集合中的其他文本的文本编码值之间的相似度确定的。上述方案,能够提升去重效率。
技术关键词
节点
文本去重方法
通信系统
通知
模型预训练
组合模块
编码模块
处理器
可读存储介质
程序
指令
存储器
电子设备
格式
计算机