摘要
本发明涉及知识库构建领域,公开了一种辅助数字员工问答的知识库构建方法,方法包括以下步骤:采集企业内部多模态数据,包括文档数据、语音数据以及元数据;对采集的数据进行信息量分析,通过信息熵理论筛选高价值数据;对通过筛选的多模态数据进行交互验证,以分析数据一致性;对验证后的数据进行动态校正,结合预测模型和观测模型减小数据噪声;对经过校正的数据进行语义提取与聚类优化,生成知识条目。本发明通过多模态数据采集、动态校正、语义提取、分布式更新及智能问答的闭环流程,显著提升数据处理效率、知识库质量和问答精准度,解决了现有技术中非结构化数据处理效率低、更新滞后及缺乏动态优化能力的问题。