一种基于多种模态信息的中文拼写纠错方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于多种模态信息的中文拼写纠错方法
申请号:
CN202410725181
申请日期:
2024-06-05
公开号:
CN118627494A
公开日期:
2024-09-10
类型:
发明专利
摘要
本发明提供一种基于多种模态信息的中文拼写纠错方法,使用文本的语义信息、汉字的发音信息和字形信息,在发音信息中融入了拼音字母在键盘上的坐标信息,使得模型能够感知拼音字母在键盘上的位置信息,以提升模型对于拼音输入的错误文本的纠错性能;在字形信息中融入的每个汉字的图像,提升模型对于手写输入的错误文本的纠错性能。最后,通过特征融合的模块,将多种模态的信息选择性地进行融合,使模型能够处理不同输入方式产生的错误。
技术关键词
拼写纠错方法
汉字
拼音
发音特征
编码
代表
键盘
模态特征
字形特征
序列
二维位置信息
文本
语义特征
坐标
字符
字母
融合语义