一种基于Sentence-BERT和KMeans模型的基因功能分类方法和装置
申请号:CN202411860425
申请日期:2024-12-17
公开号:CN119862440A
公开日期:2025-04-22
类型:发明专利
摘要
本发明公开了一种基于Sentence‑BERT和KMeans模型的基因功能分类方法和装置。方法包括如下步骤:获得模型所需数据,该模型所需数据后续列出;通过预训练和任务微调,SBERT能更好地捕捉基因功能描述中的细粒度语义差异,将该数据输入到预先训练好的SBERT中生成Sentence Embeddings;将Sentence Embeddings继续输入至KMeans模型中训练经肘部法调参,得到最佳的K值(分类簇数)。本发明基于建立的基因功能总结知识库,通过使用SBERT深度学习模型与KMeans无监督机器学习模型相结合的建模方法为基因的分类提供了可靠的方法。
技术关键词
分类方法
BERT模型
基因
文本
聚类
监督机器学习
深度学习模型
数据
参数
分类装置
标记
建模方法
显示器
语义
存储器
处理器
编码器
误差
分词
纵轴