BI神器Power Query(7)-- PQ从文本文件导入数据(1/2)

文本文件是经常使用的数据文件格式,PQ可以方便的导入文本文件中的数据,然后在Excel可以进行后续加工和处理。

依次单击【数据】选项卡>【新建查询】>【从文件】,其中的【从CSV】和【从文本】两个命令有些令人混淆。

从名称上看,似乎【从CSV】用于导入CSV文件,【从文本】用于导入其他文本文件,其实这两个命令的功能是完全相同的,点击任何一个命令,其【导入数据】对话框都是相同的,所支持的文件类型为:csv、txt和prn。

其实CSV不是一种数据格式,因为并不存在CSV文件格式通用标准,只是在RFC 4180 中对其进行了基础性的描述,系统之间完全可以定义私有的专用CSV格式标准用于数据交换。在这样宽松的约束条件下,可想而知会产生很多CSV变体,也就无法保证CSV文件完全互通,但是这并不妨碍CSV文件成为简单数据交换业务场景中的常用文件格式。

文本文件的格式就更随心所欲了,这里姑且把csv、tsv、txt和prn统一称为文本(数据)文件。

在Excel中【另存为】对话框中,有如下5种文本文件格式供选择,如果是其他信息系统的输出文件,那么文本格式标准可能就不同了。


Excel文件中的数据如下图所示。

Excel文件中的内容是相同的(如下图所示),但是导出文件的格式不同,导致文本文件的编码也就不同,在PQ导入数据时需要使用相应的编码方式,多数情况下PQ可以自动识别文本文件编码。


  • 逗号分隔的CSV文件,编码格式为:GB2312

  • Unicode,编码格式为:Unicode

  • 逗号分隔UTF8,编码格式为:Unicode(UTF-8)

    扫描二维码关注公众号,回复: 9484639 查看本文章
  • 带格式空格分隔文本文件(prn),编码格式为:GB2312

在Word中查看prn文件可以发现字段之间使用多个空格做分隔符,并且标题行的空格个数和其他数据行不同,但是PQ都可以正确解读其中的数据。

  • 制表符分隔文本文件,编码格式为:GB2312

PQ正确识别数据之后,点击【加载】按钮就可以将文本数据加载到Excel工作表中了。

发布了107 篇原创文章 · 获赞 49 · 访问量 14万+

猜你喜欢

转载自blog.csdn.net/taller_2000/article/details/102354369