摘要
本发明涉及自然语言生成技术领域,公开了一种多层次价值体系构建方法和系统,方法包括基于人工设定的价值锚定词构建价值体系的第一层;从真实世界的语料库中挖掘价值单元:基于词性标注词序列生成候选短语,并采用远监督集成训练技术训练短语质量评估器,以从候选短语中进行筛选,将筛选出的短语作为价值单元;在价值锚定词的引导下,对相似语义的价值单元进行聚类,形成价值体系的第三层;将基于聚类结果归纳出的概括性短语作为价值体系的第二层,从而构建多层次价值体系。本发明提出的方法自动化程度高,并且强调多技术路径融合与真实世界语料驱动,构建的价值体系覆盖广泛且内涵丰富。