摘要
本申请公开了一种PDF文档生成方法及装置。其中,该方法包括:获取待生成PDF文档的目标文本及指定字体;针对目标文本中每个字符,确定其编码信息,并从指定字体的第一编码库检索以判断该字符为生僻字或非生僻字;若识别出生僻字,则确定包含这些生僻字编码信息的第二编码库,当存在单一第二编码库时,选用此编码库对应的字体作为生僻字的显示字体,若存在多个第二编码库,应用预训练的字体识别模型分析生僻字的上下文信息及其对应字体,确定最佳显示字体;采用指定字体显示所有非生僻字,并使用所确定的显示字体显示各个生僻字,完成目标文本对应的PDF文档生成。本申请解决了PDF文档生成场景中生僻字显示不准确或缺失的技术问题。