一种基于大语言模型的内容生成方法、装置、设置及介质
申请号:CN202510874836
申请日期:2025-06-27
公开号:CN120724990A
公开日期:2025-09-30
类型:发明专利
摘要
本申请公开了一种基于大语言模型的内容生成方法、装置、设置及介质,涉及自然语言处理技术领域,包括:对待处理文档进行预设预处理操作得到处理后文档,从处理后文档中获取目标结构化数据,根据目标结构化数据生成待解析知识片段与上下文锚点;基于待解析知识片段训练初始哈希编码器得到目标哈希编码器,利用目标哈希编码器对待解析知识片段哈希得到目标哈希码,存储目标哈希码至预设哈希码索引库;利用目标哈希编码器将获取的查询语句转变为查询哈希码,基于查询哈希码及目标哈希码确定目标知识片段;将目标知识片段、获取的目标上下文信息及目标证据链输入目标大语言模型生成目标输出内容。解决了检索效率以及上下文信息保持等问题。
技术关键词
大语言模型
内容生成方法
编码器
锚点
语句
索引
文本提取技术
图像理解技术
解析器
数据
汉明距离
内容生成装置
表格
自然语言
图片
分析器
格式化
存储模块
可读存储介质