Skip to content

流处理

流处理支持全量增量一条化任务,包含全量数据迁移、数据清洗和转换、数据实时同步等多个功能点。处理器: Mysql/InfluxDB/Kafka/MongDB/OceanBase/Oracle/Pgsql/Sqlserver等

功能入口

  • 开始创建任务流

配置抽取器

  • 拖取抽取器:本例配置两个数据源,分别是mysql和oracle。编辑按钮修改处理器名字。

  • 编辑按钮:可测联通性, 表名可下拉获取,当前配置可以保存为预设。点问好查手册

  • 输出按钮:可给指定列做主键设置、溯源、删除等操作。所有处理器配置都一样

配置过滤器

  • 配置过滤器: 类似抽取器,把过滤器作为抽取器的下游。支持公式过滤和基本过滤

配置转换器

  • 配置普通列: 类似抽取器,把转换器作为过滤器的下游。支持公式换。本列使用加法

  • 配置公式列:列名、选公式、输入公式内容。本列把event_value转成整形后加10

配置join处理器

  • 关联关系配置: 选择关联方式、选择左表关联字段、选择右表关联字段

  • 关联字段配置:拖入用户行为表数据,拖入用户信息表数据

配置加载器

  • 配置加载器: 类似拖取,手动填入表名,如果表不存在自动创建

事件检查器使用

  • 事件检查器使用:未合规配置会列出,按照提示修正即可

任务流执行

  • 配置完成后的任务流展示如下

  • 执行任务流: 点击右上角按钮。状态变更日志、处理记录条数、处理器状态、任务流状态、可以做暂停、取消、恢复等等操作。

数据观察

  • 源表信息如下

    用户信息表:

    用户行为表:

  • 目标表信息如下:宽表数据已经生成,空记录已过滤,公式列值在原来基础上加10

  • 原表增删改记录,目标表数据秒级变更。如用户行为表修改600为800.目标表展示