一种语音问答场景下的RAG召回率提升方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种语音问答场景下的RAG召回率提升方法及装置
申请号:CN202511040109
申请日期:2025-07-28
公开号:CN120913552A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种语音问答场景下的RAG召回率提升方法及装置,涉及数据处理的技术领域,方法包括:对包含语音识别结果的原始语料进行语义清洗处理,并对清洗后的原始语料进行语义压缩,并利用多个候选嵌入向量生成模型分别执行向量生成操作,输出词向量;针对每个词向量,计算语义保真度得分;对多个语义保真度得分进行评估,选择多个候选嵌入向量生成模型中,语义保真度得分最优的目标嵌入向量生成模型;针对数据输入计算每个词语的词频值与逆文档频率值,判别词语是否为专业热词,筛选出专业热词构建热词词表;将目标嵌入向量生成模型输出的嵌入向量与热词词表联合输入至问答模块,输出目标答案文本。本发明能够提高语音问答场景下的RAG召回率。
技术关键词
问答场景 词语 语音 语义向量 训练样本集 数据 专业 分词 频率 网络接口 机制 输出模块 电子设备 答案 可读存储介质 算法 设备通信 文本
系统为您推荐了相关专利信息
检索技术 关键词 查新方法 文本 指标
会议管理系统 声纹特征 大屏装置 语音 实时显示方法
语义向量 数据管理方法 扩展型 数据管理系统 知识图谱数据
客户 人工智能系统 词语数据库 样本 商品评论数据
履带结构 机器人 升降机械臂 机身 射线扫描仪