一种样式风格对齐的DOCX格式文档翻译系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种样式风格对齐的DOCX格式文档翻译系统
申请号:CN202510945150
申请日期:2025-07-09
公开号:CN120725032A
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开一种样式风格对齐的DOCX格式文档翻译系统,通过文档解析工具对DOCX格式文档进行解析,得到XML格式文本;对XML格式文本中每个Paragraph对象样式标签进行简化;将简化后XML格式文本送入大语言模型得到译文XML格式文本;对于每个译文XML格式文本进行XML标签完整性校验;若校验结果满足完整性要求,则按照译文XML格式文本的对应顺序还原原始样式标签;通过文档解析工具将还原后的译文XML格式文本生成译文DOCX格式文档。本发明有效解决了专业文档翻译中格式保真与翻译质量的平衡问题,显著提升了样式对齐准确率和翻译效率,特别适用于法律合同、技术手册等需要严格保留格式的专业文档翻译场景。
技术关键词
文档翻译系统 格式 样式 文本 大语言模型 解析工具 标签 对象 生成译文 风格 机器翻译 专业 手册 字母 场景