读者指令
列出的后缀以当前前缀< ReaderKeyword >
在映射文件中。默认情况下,< ReaderKeyword >
为数据文件读取器数据文件.
数据集
这个指令的值是单个文本文件(*.txt)或压缩文本文件的名称。(* .txt.gz)。
必需的/可选
要求
映射文件的语法
DATAFILE_DATASET“C: \ \ \ myfile.txt文本数据”
工作台参数
源数据文件(年代)
GROUP_BY_DATASET
当该值设置为No时,该读取器将使用的唯一特性类型是读取器类型名。
当该值设置为Yes时,每个数据集的特性类型是数据集的文件名(没有路径或扩展名)。
必需的/可选
要求
值
YES | NO(默认)
映射文件的语法
GROUP_BY_DATASET“是的”
工作台参数
功能类型名称(s)
READ_BOTTOM_UP
这个可选指令指定输入文件是否应该倒着读,从文件的末尾到顶部。当只需要读取大文件末尾的几个特性时,这个特性非常有用。
如果一次性读取整个文件,该指令将被忽略(READ_WHOLE_FILE_AT_ONCE
).
必需的/可选
可选
工作台参数
读自底向上
READ_WHOLE_FILE_AT_ONCE
这个可选指令指定是否应该将整个输入文件读入单个特性的单个属性,而不是每行生成一个特性。
必需的/可选
可选
工作台参数
一次读取整个文件
SKIP_LINES
这个指令用于设置文件顶部要跳过的行数。默认情况下,不跳过任何行。跳过的每一行都记录到日志文件中。如果文件包含应该跳过的描述性材料的标题行,这个选项是有用的。
如果一次性读取整个文件,该指令将被忽略(READ_WHOLE_FILE_AT_ONCE
).如果倒着读(READ_BOTTOM_UP
),这些行会从文件末尾跳过。
值
<数>
必需的/可选
可选
工作台参数
要跳过的行数
SKIP_FOOTER
该指令用于设置文件底部要跳过的页脚行数。默认情况下,不跳过页脚行。跳过的每个页脚行都记录到日志文件中。如果文件包含应该跳过的描述性材料的页脚行,则此选项非常有用。
如果一次性读取整个文件,该指令将被忽略(READ_WHOLE_FILE_AT_ONCE
).如果倒着读(READ_BOTTOM_UP
),这些行会从文件的顶部跳过。
值
<数>
必需的/可选
可选
工作台参数
要跳过的页脚行数
编码
默认值为空,表示如果文件中存在字节顺序标记(Byte Order Marker, BOM),将自动检测到字符编码。否则,所有输入字符串将以系统编码方式进行编码。
注意:只有UTF编码以字节顺序标记(Byte Order Marker, BOM)的形式存储,它是可选的,但在选择这些编码之一时是默认的,读取时将自动检测。所有其他字符集将需要显式识别,否则它们将被读取为系统。
值
< >编码
编码 |
utf - 8 |
UTF-16LE |
UTF-16BE |
ANSI |
繁体 |
SJIS |
CP437 |
CP708 |
CP720 |
CP737 |
CP775 |
CP850 |
CP852 |
CP855 |
CP857 |
CP860 |
CP861 |
CP862 |
CP863 |
CP864 |
CP865 |
CP866 |
CP869 |
CP932 |
CP936 |
CP950 |
CP1250 |
CP1251 |
CP1252 |
CP1253 |
CP1254 |
CP1255 |
CP1256 |
CP1257 |
CP1258 |
ISO8859-1 |
ISO8859-2 |
ISO8859-3 |
ISO8859-4 |
ISO8859-5 |
ISO8859-6 |
ISO8859-7 |
ISO8859-8 |
ISO8859-9 |
ISO8859-13 |
ISO8859-15 |
工作台参数
字符编码