一种以大语言模型为编码器的文档检索方法和装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种以大语言模型为编码器的文档检索方法和装置
申请号:
CN202510459931
申请日期:
2025-04-14
公开号:
CN120407782A
公开日期:
2025-08-01
类型:
发明专利
摘要
本发明实施例涉及一种以大语言模型为编码器的文档检索方法和装置,所述方法包括:选择一款已经完成预训练且能一次性处理K级上下文的大语言模型作为查询、文档、联合编码器;以查询、文档编码器为核心构建相似性评分模型,以联合编码器为核心构建相关性评分模型,并进行模型训练;训练结束后,根据用户输入的查询文本和相似性评分模型对用户指定的文档库进行文档初选,并根据用户输入的查询文本和相关性评分模型对初选文档序列进行文档终选得到终选文档序列向当前用户反馈。本发明可以提升检索准确度。
技术关键词
文档检索方法
编码器
文本
优化器
大语言模型
序列
编码向量
分词
样本
标签
数据
处理单元
语义特征提取
输入端
模式
矩阵
参数
模型训练模块
索引