作者:KING逊咖 | 来源:互联网 | 2023-08-13 19:28
DataX FtpWriter 说明
1 快速介绍
FtpWriter提供了向远程FTP文件写入CSV格式的一个或者多个文件,在底层实现上,FtpWriter将DataX传输协议下的数据转换为csv格式,并使用FTP相关的网络协议写出到远程FTP服务器。
写入FTP文件内容存放的是一张逻辑意义上的二维表,例如CSV格式的文本信息。
2 功能与限制
FtpWriter实现了从DataX协议转为FTP文件功能,FTP文件本身是无结构化数据存储,FtpWriter如下几个方面约定:
-
支持且仅支持写入文本类型(不支持BLOB如视频数据)的文件,且要求文本中shema为一张二维表。
-
支持类CSV格式文件,自定义分隔符。
-
写出时不支持文本压缩。
-
支持多线程写入,每个线程写入不同子文件。
我们不能做到:
- 单个文件不能支持并发写入。
3 功能说明
3.1 配置样例
{"setting": {},"job": {"setting": {"speed": {"channel": 2}},"content": [{"reader": {},"writer": {"name": "ftpwriter","parameter": {"protocol": "sftp","host": "***","port": 22,"username": "xxx","password": "xxx","timeout": "60000","connectPattern": "PASV","path": "/tmp/data/","fileName": "yixiao","writeMode": "truncate|append|nonConflict","fieldDelimiter": ",","encoding": "UTF-8","nullFormat": "null","dateFormat": "yyyy-MM-dd","fileFormat": "csv","header": []}}}]}
}
3.2 参数说明
-
protocol
-
host
-
描述:ftp服务器地址。
-
必选:是
-
默认值:无
-
port
-
timeout
-
username
-
描述:ftp服务器访问用户名。
-
必选:是
-
默认值:无
-
password
-
描述:ftp服务器访问密码。
-
必选:是
-
默认值:无
-
path
-
fileName
-
writeMode
-
fieldDelimiter
-
描述:读取的字段分隔符
-
必选:否
-
默认值:,
-
compress
-
encoding
-
描述:读取文件的编码配置。
-
必选:否
-
默认值:utf-8
-
nullFormat
-
dateFormat
-
fileFormat
-
header
3.3 类型转换
FTP文件本身不提供数据类型,该类型是DataX FtpWriter定义:
DataX 内部类型 | FTP文件 数据类型 |
---|
| |
Long | Long -> 字符串序列化表示 |
Double | Double -> 字符串序列化表示 |
String | String -> 字符串序列化表示 |
Boolean | Boolean -> 字符串序列化表示 |
Date | Date -> 字符串序列化表示 |
其中:
- FTP文件 Long是指FTP文件文本中使用整形的字符串表示形式,例如"19901219"。
- FTP文件 Double是指FTP文件文本中使用Double的字符串表示形式,例如"3.1415"。
- FTP文件 Boolean是指FTP文件文本中使用Boolean的字符串表示形式,例如"true"、“false”。不区分大小写。
- FTP文件 Date是指FTP文件文本中使用Date的字符串表示形式,例如"2014-12-31",Date可以指定format格式。
4 性能报告
5 约束限制
略
6 FAQ
略