VEM-Token节拍捕捉和对齐模型建构的方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
VEM-Token节拍捕捉和对齐模型建构的方法
申请号:CN202511249168
申请日期:2025-09-03
公开号:CN120748450B
公开日期:2025-11-21
类型:发明专利
摘要
VEM‑Token节拍捕捉和对齐模型建构的方法,是基于VEM‑Token声乐情绪多模态模型方法,采用音乐节拍来切分声乐文件为VEM‑Token词元的深化创新。本方法核心是建立声乐文件的节拍模型、节拍捕捉模型和节拍对齐模型,前者将样本声乐文件通过多重滤波器分离歌声、伴奏声和情绪波动,在频谱格式文件中捕捉节拍的起点和终点,后者通过起点微调模型和终点微调模型,使得用户模仿文件与样本文件完成节拍对齐。采用包括节拍基础模型、谐波冲击、联合学习、谐波频率分层、动态时间规整等模型来捕捉节拍,采用基础模型、起点微调和终点微调、全程对齐校验、节拍编辑器、自由发挥节拍、重复对齐、通信接口协议等模型的构建,使得本方法适合接入Agent音乐智能体和AI音乐应用。
技术关键词
终点 声乐 指针 序列 双向通信协议 通信接口协议 样本 多重滤波器 音乐系统 动态时间规整 谐波 卷积循环神经网络 频率 乐器 时间差 隐马尔可夫模型 多模态 热力图 标记
系统为您推荐了相关专利信息
动态时间规整算法 集合经验模态分解 序列 短时交通流预测 非暂态计算机可读存储介质
氢氧舱 人物模型 高压 参数 身体
资源管理策略 大数据 居民 模拟模型 线性规划算法
饱和度 智能监测系统 序列 队列 多模态
输出特征 钓鱼网站检测方法 多模态 梯度下降算法 数据