读者指令
显示的后缀以当前前缀< ReaderKeyword >
在映射文件中。默认情况下,< ReaderKeyword >
Textline的读者是TEXTLINE.
数据集
这个指令的值是单个文本文件的名称。文本文件通常的扩展名是.txt和.txt.gz。
必需的/可选
要求
映射文件的语法
TEXTLINE_DATASET“C: \ \ \ myfile.txt文本数据”
工作台参数
源文本文件(年代)
GROUP_BY_DATASET
当该值设置为No时,此读取器将使用的唯一特性类型是text_line
.
当该值设置为Yes时,每个数据集的特性类型是数据集的文件名(没有路径或扩展名)。这个指令的默认值是No。
值
是的|不
必需的/可选
要求
映射文件的语法
GROUP_BY_DATASET“是的”
READ_BOTTOM_UP
这个可选指令指定输入文件是否应该倒着读,从文件的末尾到顶部。当只需要读取大文件末尾的几个特性时,这个特性非常有用。如果。该指令将被忽略READ_WHOLE_FILE_AT_ONCE
设置为Yes。
必需的/可选
可选
工作台参数
读自底向上
READ_WHOLE_FILE_AT_ONCE
这个可选指令指定是否应该将整个输入文件读入单个特性的单个属性,而不是每行生成一个特性。
这种方法保留了文件的准确内容,包括行分隔符、EOF标记等。
必需的/可选
可选
工作台参数
一次读取整个文件
SKIP_LINES
要求/可选:可选
可以列出该字段,以指示在文件顶部要跳过的行数。默认情况下,不跳过任何行。跳过的每一行都记录到日志文件中。如果文件包含应该跳过的字段名或其他描述性材料的标题行,这是非常有用的。
价值观:<数>
工作台参数:要跳过的行数
SKIP_FOOTER
可以列出该字段,以指示在文件底部要跳过的页脚行数。默认情况下,不跳过页脚行。跳过的每个页脚行都记录到日志文件中。
如果文件包含应该跳过的描述性材料的页脚行,这是很有用的。如果一次性读取整个文件,该指令将被忽略。如果反向读取,则从文件顶部跳过行。
必需的/可选
可选
值
<数>
工作台参数
要跳过的页脚行数
编码
这个可选规范控制读取输入文件时使用的字符编码。
默认值为空,表示如果文件中存在字节顺序标记(Byte Order Marker, BOM),将自动检测到字符编码;否则,所有输入字符串将以系统编码方式进行编码。
注意,只有UTF编码以BOM的形式存储,它是可选的,但默认情况下,当选择这些编码之一时,它将在读取时自动检测。所有其他字符集都需要显式地标识,否则它们将被读取为系统编码。
必需的/可选
可选
值
< >编码
工作台参数
字符编码
编码 |
utf - 8 |
UTF-16LE |
UTF-16BE |
ANSI |
繁体 |
SJIS |
CP437 |
CP708 |
CP720 |
CP737 |
CP775 |
CP850 |
CP852 |
CP855 |
CP857 |
CP860 |
CP861 |
CP862 |
CP863 |
CP864 |
CP865 |
CP866 |
CP869 |
CP932 |
CP936 |
CP950 |
CP1250 |
CP1251 |
CP1252 |
CP1253 |
CP1254 |
CP1255 |
CP1256 |
CP1257 |
CP1258 |
ISO8859-1 |
ISO8859-2 |
ISO8859-3 |
ISO8859-4 |
ISO8859-5 |
ISO8859-6 |
ISO8859-7 |
ISO8859-8 |
ISO8859-9 |
ISO8859-13 |
ISO8859-15 |