摘要
本发明提供一种基于大数据的会议信息处理方法及系统,获取待处理会议文档及所属的会议文档语料库;计算词项的位置与区域加权词频;基于文档主题类簇的划分结果,计算所述词项在所属类簇内的类内逆文档频率;基于所述位置与区域加权词频与所述类内逆文档频率的乘积得到所述词项的初始权重;筛选出权重大于第一预设阈值的核心词项;构建所述核心词项的加权共现网络图;将各核心词项的初始权重作为在所述加权共现网络图中的初始权重,通过预设的图排序迭代算法,根据图中节点的连接关系和边的权重,迭代更新各核心词项节点的权重,当各节点的权重收敛或达到预设迭代次数时,将得到的权重作为所述核心词项的权重。