一种基于大数据的抽样误差动态校准方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大数据的抽样误差动态校准方法及系统
申请号:CN202511334126
申请日期:2025-09-18
公开号:CN120851033B
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于大数据的抽样误差动态校准方法及系统,属于自然语言处理技术领域。建立抽样关键词库与抽样文本库,构建具有有向属性的抽样维度组合对,依此对抽样文本进行分层,形成分层样本集,以评估抽样维度组合对在抽样文本间的语义连接强度,进而构建语义社区二维坐标系;通过设置聚类尺度、计算分布密度指标,结合分离度评估与语义聚类约束条件,动态调整聚类尺度,以平衡分类精细度与误差校准效率,生成最优语义社区分类结果,以分离出语义社区间的连接关键词并进行断层风险评估和图谱展示,实现抽样误差的动态校准;进而能够在语义分布随数据更新发生变化时,及时对滞后于语义变化的语义社区间的断层风险进行评估。
技术关键词
语义 关键词 动态校准方法 动态校准系统 分层 聚类 大数据 文本 坐标系 样本 索引 分析单元 可视化单元 分析模块 密度 展示单元 显示终端 风险