基于文本相关性的大模型金融数据合成方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于文本相关性的大模型金融数据合成方法及系统
申请号:
CN202411442099
申请日期:
2024-10-16
公开号:
CN119474896A
公开日期:
2025-02-18
类型:
发明专利
摘要
本发明提出基于文本相关性的大模型金融数据合成方法及系统。首先将金融领域文档结合金融特性深度优化向量生成过程进行去重,转化为低维向量表示并构建语料图,然后依据金融数据独特性重新定义语料图的节点和边精心构建语料图,再然后利用基于定义的节点优先级和利用贪心算法串联文档,引入金融风险评估和市场趋势分析因素,根据金融数据的相关性和重要性动态调整路径搜索策略,优先串联最相关的文档,形成语义高度连贯流畅的上下文作为大模型金融预训练语料。
技术关键词
金融
大语言模型
大规模文本数据
风险评估值
贪心算法
术语
指标
数据分布
语义
样本
搜索模块
概念
定义
遗传算法
矩阵
节点
多任务
关系