自然资源大模型问答的语义增强自适应分块方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
自然资源大模型问答的语义增强自适应分块方法及系统
申请号:CN202511322392
申请日期:2025-09-16
公开号:CN120822526B
公开日期:2025-12-05
类型:发明专利
摘要
本发明提供了一种自然资源大模型问答的语义增强自适应分块方法及系统,旨在解决术语边界识别困难、语义完整性破坏等问题。该方法融合三项核心技术:主题感知粗粒度段落划分、自适应滑动窗口主题层级划分、嵌入感知的上下文自适应文本分割。系统先解析自然资源长文本结构,识别标题与主题层级并对齐关联内容;依据主题感知策略提取段落,按语法规则细分为句子集合;采用改进的滑动窗口机制将句子划分为窗口句块组。核心在于引入动态聚合阈值机制,通过嵌入感知的上下文语义分割技术,计算相邻句块之间的语义关联度,并结合相似度分布变化趋势,动态调整阈值判断是否合并句块,实现语义边界的自适应划定,以生成结构清晰、语义连贯的文本分块。
技术关键词
语义关联度 分块方法 层级 中文语法规则 自然资源 文本 主题 堆栈结构 动态 句法结构 树状结构 语义分割技术 滑动窗口机制 阈值机制 生成结构 策略 语义向量