文本向量化方法、装置、电子设备、存储介质及程序产品
申请号:CN202510699485
申请日期:2025-05-28
公开号:CN120235150B
公开日期:2025-08-08
类型:发明专利
摘要
本申请涉及一种文本向量化方法、装置、电子设备、存储介质及程序产品,涉及自然语言处理领域。该方法包括:确定目标文本对应的特征向量,其中,特征向量包括第一查询向量、第一键向量和值向量;分别对第一查询向量以及第一键向量进行非线性处理,得到第二查询向量以及第二键向量;其中,第二查询向量和第二键向量在向量空间中的分布特性均介于各向异性和各向同性之间;分别对第二查询向量以及第二键向量进行旋转位置编码,得到第三查询向量和第三键向量;基于第三查询向量、第三键向量以及值向量,确定目标文本对应的语义特征向量,其中,语义特征向量用于指示目标文本的语义信息,能够提升对文本数据的语义表达的精确性。
技术关键词
文本
语义
编码
非线性
计算机程序产品
处理单元
计算机执行指令
矩阵
电子设备
处理器
可读存储介质
椭圆形
自然语言
车辆
存储器
数据