一种用于能源电力数据安全领域的小规模长文本中文生成式对话模型
申请号:CN202411737842
申请日期:2024-11-29
公开号:CN119782459A
公开日期:2025-04-08
类型:发明专利
摘要
本发明公开了一种用于能源电力数据安全领域的小规模长文本中文生成式对话模型,包括自定义Tokenizer模块、嵌入层、多层轻量化Transformer块和输出层;所述自定义Tokenizer模块用于将输入语句生成词汇表,并对词汇进行编码形成Token序列;在嵌入层,将所述Token序列映射成嵌入向量,并输入到多层轻量化Transformer块,获取每个Token的语义和上下文关系的加权向量,输入到输出层,输出层生成最终文本输出。能够在低显存设备上完成长文本中文生成式对话模型的训练和推理。与现有技术相比,本发明不仅降低了硬件要求,还提升了中文对话生成任务的效率和适用性。
技术关键词
数据安全
序列
构建训练集
小规模
适配器
中文文本
电力
分词
机制
语句
语义
模块
关系
注意力
编码
算法
能源
精度