PDF文档生成方法及装置

申请号：CN202510300809

申请日期：2025-03-13

公开号：CN120218012A

公开日期：2025-06-27

类型：发明专利

摘要

本申请公开了一种PDF文档生成方法及装置。其中，该方法包括：获取待生成PDF文档的目标文本及指定字体；针对目标文本中每个字符，确定其编码信息，并从指定字体的第一编码库检索以判断该字符为生僻字或非生僻字；若识别出生僻字，则确定包含这些生僻字编码信息的第二编码库，当存在单一第二编码库时，选用此编码库对应的字体作为生僻字的显示字体，若存在多个第二编码库，应用预训练的字体识别模型分析生僻字的上下文信息及其对应字体，确定最佳显示字体；采用指定字体显示所有非生僻字，并使用所确定的显示字体显示各个生僻字，完成目标文本对应的PDF文档生成。本申请解决了PDF文档生成场景中生僻字显示不准确或缺失的技术问题。

技术关键词

字体编码字符文本文档生成方法循环神经网络模型文档生成装置深度残差网络长短期记忆网络关系对象生成场景计算机程序产品处理器分析模块存储器标签样本电子设备