一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法
申请号:CN202411600974
申请日期:2024-11-11
公开号:CN119479908B
公开日期:2025-10-28
类型:发明专利
摘要
本发明提供一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法,包括:获取鲜味肽数据,并对所述鲜味肽数据进行预处理;通过分子指纹、分子描述符和氨基酸矩阵对预处理后的鲜味肽数据进行数字化表征;通过皮尔森相关性、F回归、互信息和包裹式对数字化表征后的鲜味肽数据进行特征筛选,得到筛选后的分子描述符、氨基酸计数和分子指纹;通过筛选后的分子描述符、氨基酸计数和分子指纹进行构建子模型,并通过回归模型评价指标进行评价,选择效果最好的前6个子模型进行集成模型构建,集成模型通过梯度提升机模型进行拟合;通过构建好的集成模型进行鲜味肽识别阈值预测。本发明可以为大量鲜味肽进行定量预测,从而为大批量筛选鲜味肽提供定量参考。
技术关键词
阈值预测方法 描述符 梯度提升机 分子 序列 指纹 数据 非线性特征 指标 随机森林 包裹 参数 矩阵 表达式 感官 符号 变量 代表 算法