生物模型的训练方法及生物序列的处理方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
生物模型的训练方法及生物序列的处理方法
申请号:CN202411010942
申请日期:2024-07-26
公开号:CN118538299B
公开日期:2024-12-27
类型:发明专利
摘要
本发明提供了一种生物模型的训练方法及生物序列的处理方法,可以应用于人工智能技术领域。该生物模型的训练方法包括:根据蛋白质序列数据集和核糖核酸序列数据集按照预设输入格式构建蛋白质‑核糖核酸序列对,蛋白质‑核糖核酸序列对包括预设提示词;利用预设分词器对蛋白质序列数据集和核糖核酸序列对进行分词处理,得到训练序列对;将训练序列对输入生物模型中,得到与训练序列对对应的预测序列对;根据预测序列对、训练序列对和预设提示词训练生物模型,得到训练后的生物模型。通过本方法可以实现同时理解和生成蛋白质及核糖核酸序列,为下游应用对接提供基础。
技术关键词
序列 核糖核酸 生物 矩阵 字词 注意力 多任务 分词 人工智能技术 数据 字符 格式 编码 基础