文本文件是经常使用的数据文件格式,PQ可以方便的导入文本文件中的数据,然后在Excel可以进行后续加工和处理。
依次单击【数据】选项卡>【新建查询】>【从文件】,其中的【从CSV】和【从文本】两个命令有些令人混淆。
从名称上看,似乎【从CSV】用于导入CSV文件,【从文本】用于导入其他文本文件,其实这两个命令的功能是完全相同的,点击任何一个命令,其【导入数据】对话框都是相同的,所支持的文件类型为:csv、txt和prn。
其实CSV不是一种数据格式,因为并不存在CSV文件格式通用标准,只是在RFC 4180 中对其进行了基础性的描述,系统之间完全可以定义私有的专用CSV格式标准用于数据交换。在这样宽松的约束条件下,可想而知会产生很多CSV变体,也就无法保证CSV文件完全互通,但是这并不妨碍CSV文件成为简单数据交换业务场景中的常用文件格式。
文本文件的格式就更随心所欲了,这里姑且把csv、tsv、txt和prn统一称为文本(数据)文件。
在Excel中【另存为】对话框中,有如下5种文本文件格式供选择,如果是其他信息系统的输出文件,那么文本格式标准可能就不同了。
Excel文件中的数据如下图所示。
Excel文件中的内容是相同的(如下图所示),但是导出文件的格式不同,导致文本文件的编码也就不同,在PQ导入数据时需要使用相应的编码方式,多数情况下PQ可以自动识别文本文件编码。
-
逗号分隔的CSV文件,编码格式为:GB2312
-
Unicode,编码格式为:Unicode
-
逗号分隔UTF8,编码格式为:Unicode(UTF-8)
扫描二维码关注公众号,回复: 9484639 查看本文章
- 带格式空格分隔文本文件(prn),编码格式为:GB2312
在Word中查看prn文件可以发现字段之间使用多个空格做分隔符,并且标题行的空格个数和其他数据行不同,但是PQ都可以正确解读其中的数据。
- 制表符分隔文本文件,编码格式为:GB2312
PQ正确识别数据之后,点击【加载】按钮就可以将文本数据加载到Excel工作表中了。