使用SQL语句对excel表格进行特定数据的获取

背景:今天接到一个有关江苏省企业信息汇总的excel文件,大小约为48M,包含了三张表,总数据量约为48万条。按照要求需要筛选出地址为徐州市的企业。
分析:此excel文件没有设置字段,也没有进行相应的排序,各个市的信息是无序排列的,索引值仅告知我们企业的总数。由于对excel表格并不熟悉,且将48w条数据写入数据库在进行操作并导出会很麻烦,所以我首先想到的是使用SQL语句对excel文件进行查询。
工具:excel表格2016版本
具体做法:

  1. 对原始数据进行一定处理,将所需表名以及字段名更换成英文,虽然支持utf8编码格式,但是对于中文的处理还是需要加上引号。

  2. 新建一个excel文件,在上方菜单栏找到数据,并在数据选项下找到现有连接并打开。在这里插入图片描述

  3. 点击浏览更多
    在这里插入图片描述

  4. 找到我们所要处理的excel文件,因为处理的文件有可以有多个表格,所以会出现如下界面。
    在这里插入图片描述
    这里可以选择自动将首行列为标题,然后选中需要处理的表格,点击确定。

  5. 接下来,在下图界面选择属性
    在这里插入图片描述

  6. 我们在属性界面里面首先找到定义,在文本命令处可以得到当前表格的名字(即3处),选择表名后,在命令文本中输入SQL语句,即可对excel表格进行处理
    在这里插入图片描述

  7. 按照分析我们使用的语句是

select * from [ market_search$] where location like '%徐州%';
--这里的表名需要加上中括号,对字段location进行模糊查询,使用like并配合上正则表达式即可。

在这里插入图片描述
8. 最后在点击确定即可,需要注意的是,这里你需要指定是否将筛选的内容生成新的表格
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/soulproficiency/article/details/108054072
今日推荐