这一节主要讲述了爬取用户信息时候用到的一些函数,并举例讲述其主要功能。
感兴趣的小伙伴可以收藏哦!
另外,关于本代码的效果展示,以及教程,点击以下链接即可。
python爬取微博用户信息(一)—— 效果展示
python爬取微博用户信息(二)—— cookie的获取方式以及configs中参数的设置
python爬取微博用户信息(三)—— 创建MicroBlog类实例
python爬取微博用户信息(四)—— 爬取用户信息的功能函数
python爬取微博用户信息(六)—— 完整代码
目录
一、os.sep
1、功能:os.sep 根据你所处的平台,自动采用相应的分隔符号。
python是跨平台的语言,在Windows中,文件路径的分隔符为 '\',在Linux中,文件路径的分隔符为 '/' .
2、用法
(1)以我们的这个项目所在的路径举例:文件路径分隔符为 '\'
(2)代码
import os
path = 'E:' + os.sep + 'py_project' + os.sep + 'Crawling of microblog information'
print(path)
(3)结果
二、os.path.split()
1、功能: 按照路径将文件名和路径分割开。
2、用法
os.path.split('PATH')
(1)源文件中spilt
文件中提到,该函数的功能为划分一个文件名。
划分的方法:以最后一个斜杠为基准,斜杠前的为head,斜杠后的为tail,最后返回一个元祖[ head, tail ]
当然,任一部分都有可能为空。
下面我们来举例验证!
(2)代码
import os
# os.path.spilt()
head_1, tail_1 = os.path.split('E:/py_project/Crawling of microblog information/test')
print('head_1:', head_1) # E:/py_project/Crawling of microblog information
print('tail_1:', tail_1) # test
head_2, tail_2 = os.path.split('E:')
print('head_2:', head_2) # E:
print('tail_2:', tail_2) # ' '
三、os.path.realpath()
1、功能: 获取当前执行脚本的绝对路径。
虽然 os.path.abspath() 和 os.path.realpath() 均为获取当前文件的绝对路径,但是二者也是有一定差别的。
2、用法
os.path.abspath('path')
os.path.realpath('path')
(1)二者相同点: 二者均获取当前文件的绝对路径。
- 参数path为空,则返回当前文件所在目录的绝对路径
path_1 = os.path.realpath('')
path_2 = os.path.abspath('')
print(path_1) # E:\py_project\Crawling of microblog information\test
print(path_2) # E:\py_project\Crawling of microblog information\test
- 参数path为不存在的文件,则返回当前文件所在目录 + path的绝对路径
path_3 = os.path.realpath('hello.txt')
path_4 = os.path.abspath('hello.txt')
print(path_3)
print(path_4)
- 当前文件的路径
cur_path1 = os.path.realpath(__file__)
cur_path2 = os.path.abspath(__file__)
print(cur_path1)
print(cur_path2)
(2)二者不同点
- os.path.realpath() —— 先处理路径中的符号链接,再返回绝对路径
- os.path.abspath() —— 返回绝对路径,但不处理符号链接
3、代码
import os
# 参数path为空,则返回当前文件所在目录的绝对路径
path_1 = os.path.realpath('')
path_2 = os.path.abspath('')
print(path_1) # E:\py_project\Crawling of microblog information\test
print(path_2) # E:\py_project\Crawling of microblog information\test
# 参数path为不存在的文件,则返回当前文件所在目录 + path的绝对路径
path_3 = os.path.realpath('hello.txt')
path_4 = os.path.abspath('hello.txt')
print(path_3)
print(path_4)
# 当前文件的路径
cur_path1 = os.path.realpath(__file__)
cur_path2 = os.path.abspath(__file__)
print(cur_path1)
print(cur_path2)
四、os.path.isdir()
1、功能: 用于判断对象是否为一个目录,若是目录,则返回TRUE,否则,返回FALSE
2、用法
我们用两个例子去验证。
第一个是 E:/py_project/Crawling of microblog information/test
第二个是 test
显而易见,第一个是目录,第二个不是。
import os
isdir_1 = os.path.isdir('E:/py_project/Crawling of microblog information/test')
isdir_2 = os.path.isdir('test')
print(isdir_1)
print(isdir_2)
五、os.makedirs()
1、功能: 递归创建目录
2、用法
os.makedirs('path')
path既可以是绝对路径,也可以是相对路径
import os
# 创建的目录
path_1 = './new_test'
path_2 = 'E:/py_project/Crawling of microblog information/new_test/makedir'
os.makedirs(path_1)
os.makedirs(path_2)
print('创建完毕!')
我们创建的文件: