文本标注方法、装置、设备及存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
文本标注方法、装置、设备及存储介质
申请号:
CN202411968311
申请日期:
2024-12-30
公开号:
CN119377686A
公开日期:
2025-01-28
类型:
发明专利
摘要
本申请涉及自然语言处理技术领域,公开一种文本标注方法、装置、设备及存储介质。该方法包括:获取待标注文本数据;对待标注文本数据进行分割,得到多个文本片段数据;对文本片段数据进行分类并根据分类结果选取若干最接近相应的文本片段类别的文本片段数据,得到若干候选文本片段数据;对待标注文本数据和候选文本片段数据进行相似度分析,选取相似度最高的候选文本片段数据,得到目标文本片段数据;根据目标文本片段数据对待标注文本数据进行标注。本申请实施例可以在自动标注过程中保留文本内容的完整语义,提高标签的质量。
技术关键词
文本标注方法
文本处理模型
神经网络模型训练
聚类
可读存储介质
标注装置
数据嵌入
样本
电子设备
自然语言
处理器
模块
存储器
计算机
主题
语义
分段