一种基于多模态技术的联机手写文本切分方法、系统及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态技术的联机手写文本切分方法、系统及存储介质
申请号:CN202510684419
申请日期:2025-05-26
公开号:CN120599621A
公开日期:2025-09-05
类型:发明专利
摘要
本申请提供一种基于多模态技术的联机手写文本切分方法、系统及存储介质,包括:多模态数据同步采集:获取联机手写文本的轨迹序列数据及其对应的手写文本图像数据;双模态协同预测:基于所述轨迹序列数据通过区域边界回归模型预测字符边界,获取单字符的区域边界结果,同时基于所述手写文本图像数据通过字符检测分类模型预测检测框及字符类别,获取单字符的区域边界结果;状态感知联合修正:融合所述双模态协同预测的结果,结合轨迹序列中的书写状态特征,生成优化后的字符切分结果。本申请能够有效地解决现有技术中字符或词语边界的确定因手写文本的连笔与潦草而导致的切分准确率问题。
技术关键词
文本切分方法 多模态技术 检测分类模型 字符 双模态 序列 卷积特征提取 神经网络架构 轨迹 数据同步 注意力机制 损失函数优化 切分系统 阈值机制 图像 分阶段 切分装置