文本识别方法及装置、非易失性存储介质、电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本识别方法及装置、非易失性存储介质、电子设备
申请号:CN202510330485
申请日期:2025-03-19
公开号:CN120234418A
公开日期:2025-07-01
类型:发明专利
摘要
本申请公开了一种文本识别方法及装置、非易失性存储介质、电子设备。其中,该方法包括:获取训练样本集合;获取目标数据源中的待处理文本,对待处理文本进行分词处理,得到多个分词结果;根据每个分词结果在待处理文本中的文本位置以及每个分词结果中的预设特征词在第一文本中的出现频率,确定每个分词结果的权重系数;根据权重系数,对关联性指标进行加权求和,得到待处理文本与每个训练样本之间相关性得分;对相关性得分进行分类处理,得到待处理文本属于不同预设标签的概率值,并将最大概率值对应的标签确定为待处理文本的标签。本申请解决了由于相关文本识别无法有效利用关键词位置信息,造成的识别准确率受限的技术问题。
技术关键词
分词 文本识别方法 非易失性存储介质 标签 逻辑回归模型 指标 文本识别装置 数值 电子设备 计算机程序产品 频率 处理器 模块 参数 关键词 存储器 序列
系统为您推荐了相关专利信息
大语言模型 图片 视频生成模型 生成方法 数据
指示器 监控方法 图片 数据 样本
网络拓扑结构特征 药物 疾病 无标签样本 分类器
通用机器学习模型 标记 序列 节点 自然语言文本
信息检测方法 音频特征 声学特征 语义 分类器