基于FlinkCDC实现多数据中心数据到Doris实时动态采集方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于FlinkCDC实现多数据中心数据到Doris实时动态采集方法及系统
申请号:CN202410996471
申请日期:2024-07-24
公开号:CN119003586A
公开日期:2024-11-22
类型:发明专利
摘要
本发明公开了一种基于FlinkCDC实现多数据中心数据到Doris实时动态采集方法和系统,方法包含如下步骤:采集源系统的增量日志信息,并封装为DataStream数据流;配置数据同步信息;合并数据流,生成DataSyncStream数据流;更新形成DataSyncStream数据流并写入到Doris中。本发明基于Flink计算框架,采用FlinkCDC组件,实现了数据的实时采集、实时计算、一致性语义;通过数据处理组件实现了数据安全加密、自定义字段添加、DDL变更实时回放的一次性配置;优化Doris数据同步组件实现在不停服务的前提下同步任务的动态增减。
技术关键词
动态采集方法 数据中心 动态采集系统 自定义字段 数据处理组件 数据采集组件 日志 数据同步组件 封装单元 采集单元 加密 控制单元 对象 数据安全 语句 语义 逻辑