一种基于数据挖掘测试的车载语音模型优化方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于数据挖掘测试的车载语音模型优化方法及装置
申请号:CN202411737937
申请日期:2024-11-29
公开号:CN119694324B
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开涉及一种基于数据挖掘测试的车载语音模型优化方法及装置,该方法包括:获取来自车载语音服务日志系统和网络爬取系统的数据源,该数据源包括音频数据和语义数据;通过数据筛选策略将该数据源中的无效音频数据进行删除,获取目标音频数据;通过数据过滤策略将该数据源中噪声文本数据和无效文本数据进行删除,获取目标语义数据;对该目标音频数据和目标语义数据进行识别,获取badcase数据;将该badcase数据加入车载语音模型进行规避学习,以对该车载语音模型进行优化。能够通过对数据的挖掘测试持续优化模型,且标注的数据可以用作后续模型评估的数据,为模型大版本更新迭代替换等提供评估的数据集方案,提升测试效率并解决模型实时性数据问题。
技术关键词
语义 模型优化方法 音频 日志系统 文本 数据获取单元 优化装置 噪声 语音助手 数据获取模块 策略 过滤单元 语音识别模型 网络 分段 处理单元