一种基于Sentence-BERT和KMeans模型的基因功能分类方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于Sentence-BERT和KMeans模型的基因功能分类方法和装置
申请号:CN202411860425
申请日期:2024-12-17
公开号:CN119862440A
公开日期:2025-04-22
类型:发明专利
摘要
本发明公开了一种基于Sentence‑BERT和KMeans模型的基因功能分类方法和装置。方法包括如下步骤:获得模型所需数据,该模型所需数据后续列出;通过预训练和任务微调,SBERT能更好地捕捉基因功能描述中的细粒度语义差异,将该数据输入到预先训练好的SBERT中生成Sentence Embeddings;将Sentence Embeddings继续输入至KMeans模型中训练经肘部法调参,得到最佳的K值(分类簇数)。本发明基于建立的基因功能总结知识库,通过使用SBERT深度学习模型与KMeans无监督机器学习模型相结合的建模方法为基因的分类提供了可靠的方法。
技术关键词
分类方法 BERT模型 基因 文本 聚类 监督机器学习 深度学习模型 数据 参数 分类装置 标记 建模方法 显示器 语义 存储器 处理器 编码器 误差 分词 纵轴