本地表抽取器
处理模式
处理模式 | 是否支持 |
---|---|
批处理 | 支持 |
流处理 | 不支持 |
同步流 | 不支持 |
数据验证 | 不支持 |
配置
操作步骤:
拖动文件至上传区域,或者点击上传区域并选择文件进行上传
若处理器曾上传过文件,那么重新编辑当前抽取器时,将不需要重新上传,当然你仍然可以用新文件覆盖。支持文件格式:.csv, .xls, .xlsx, .json
文件大小限制:小于 16 MB
文件个数限制:1(可选)点击配置解析规则,弹出配置面板。
配置项 解释 分割符(仅csv) 指定当前文件中值的分割符。 文件编码(仅csv) 当前文件的编码格式,默认值为 UTF-8。 列信息是否定义在表头 当前文件中,表头是否为列信息。
若否,你可在文件解析完成后为数据声明表头信息。忽略空行 导入数据时是否排除空行。 忽略错误数据 用空值填充未定义的值。
如果不选择当前选项, 当遇到缺省值的行将触发错误。丢弃最后一列后面的多余数据 如果不选择当前选项,当遇到多余列的行时将触发错误。 要跳过的行数 在导入数据之前要跳过的行数。
主要用于跳过表头元数据。要导入的数据行数 要导入数据的最大行数。
主要用于跳过页脚元数据。为空时将导入所有数据注释字符(仅csv) 在行首遇到该符号表示该行为注释数据,该行数据将不会被导入。 引号字符(仅csv) 指定引号字符。 点击“解析文件”按钮,弹出如下界面:
在此界面,你可修改系统自动解析出的列信息(列名、数据类型),选择你想要导入的列。
若解析结果出现乱码,则意味着你可能需要返回上一步修改文件编码,并重新解析。
点击“保存”按钮。
输出
配置完成后,输出配置页面可以做以下操作
操作名称 | 描述 |
---|---|
配置列 | 通过删除、导入等操作配置需要往下游输出的列 |
配置主键 | 点击列名后的钥匙按钮,配置主键列 |
溯源 | 验证列是否可溯源 |