一种基于知识图谱的分子性质预测大语言模型构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于知识图谱的分子性质预测大语言模型构建方法
申请号:CN202411471393
申请日期:2024-10-22
公开号:CN119446336B
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开了一种基于知识图谱的分子性质预测大语言模型构建方法。该方法包括多个步骤:首先,利用高通量数据采集技术获取预训练语料,包括分子属性和代谢途径等相关数据。然后,基于这些数据构建关于十四个端点的知识图谱,知识图谱以三元组形式表示分子与其属性和端点间的关系。接着,使用LoRA技术对大语言模型进行预训练,采用增量学习策略优化模型,并形成专家大模型。随后,利用RAG技术从知识图谱中检索与目标端点相关的三元组,并对检索结果进行整理。通过提示词设计,专家大模型对检索到的三元组进行过滤,提取关键信息。最后,将过滤后的三元组列表转化为自然语言输入给专家大模型,生成分子性质的预测结果并提供推理依据。该方法显著提升了分子与端点化学反应预测的准确性和效率。
技术关键词
大语言模型 三元组 端点 分子 节点 构建知识图谱 查询主体 雌激素受体配体 自然语言 列表 爬虫技术 基质金属蛋白酶 知识图谱构建 数据采集技术 命名实体识别 雄激素 关系