Python爬虫从入门到放弃 02 | Python爬虫中的常用语法与模块

此博客仅为我业余记录文章所用,发布到此,仅供网友阅读参考,如有侵权,请通知我,我会删掉。
本文章纯野生,无任何借鉴他人文章及抄袭等。坚持原创!!

前言

你好。这里是Python爬虫从入门到放弃系列文章。我是SunriseCai。

本文章是我平时学习Python中常用到的一些知识点,不可做为Python的系统学习。

Python常用基本用法

Python基本数据结构

这个比较简单,建议点击链接直达去查看用法。

数据结构 特征
列表list 可变,有序
元组tuple 不可变,不可增删改
字典dict 以键值对存在
集合set 可变, 无序

Python占位符与format()

定义:

占位符 表示类型
%s 字符串
%d 整数
%f 浮点数
format() 把%替换为{}来实现格式化输出

占位符%示例:

name = input('输入你的名字:')	# SunriseCai
age = input('输入你的年龄:')	# 20
weight= input('输入你的体重:')	# 65.432
print('你的名字是%s,年龄是%d,身高是%.2f公斤' % (name, int(age), float(weight)))	
# 你的名字是SunriseCai,年龄是20,体重是65.43公斤
# %.2f意思是取2位小数

format()格式化示例:

name = input('输入你的名字:')	# SunriseCai
age = input('输入你的年龄:')	# 20
weight = input('输入你的工资:')	# 65.432
print('你的名字是{},年龄是{},体重是{}公斤'.format(name, age, weight))
# 你的名字是SunriseCai,年龄是20,体重是65.432公斤

Python条件语句

Python 编程中 if 语句用于控制程序的执行,基本形式为:

if 判断条件 1:
    执行语句 A
elif 判断条件 2:
	执行语句 B
else:
    执行语句 C

理解起来就是:如果满足条件1则执行A,不满足条件1但满足条件2则执行B,两个都不满足就执行C
示例:

num = 10
if num > 10:		# 判断num
    print('我大于10')
elif num < 10:		# num小于10就输出
    print('我小于10')
else:				# 上面都不满足就输出
    print('我等于10')
# 最终输出  我等于10

Python循环语句

这里引用自菜鸟教程的Python 循环语句

  • Python 提供了 for 循环和 while 循环:
循环类型 描述
while循环 在给定的判断条件为true时执行循环,否则推出循环体
for 循环 重复执行语句

while 循环示例:

  • 一直打印输入的字符串,直到输入end 退出循环。
while True:
    string = input('输入字符串:')
    if string == 'end':
        break			# 退出循环
    print(string)

for 循环示例:

  • 重复100遍打印Hello World
for i in range(100):
	print('Hello World')

Python的join()、split()、strip()

方法 描述
Python join() 用于将序列中的元素以指定的字符连接生成一个新的字符串。
Python strip() 用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。
Python split() 指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串

示例:

  • Python join() :
string = ['SunriseCai', 'SunriseCai', 'SunriseCai']
print('--'.join(string))	# SunriseCai--SunriseCai--SunriseCai
  • Python strip():
string = '%#SunriseCai%#'
print(string.strip('%#'))	# SunriseCai
  • Python split():
string = '%#SunriseCai%#'
print(string.split('%#'))	# ['', 'SunriseCai', '']

Python异常处理

Python中常用try/except语句取捕捉异常。
常见用法:

  • 正常执行A,如果报错就执行B,C则不管有没有报错都会执行。
try:
	执行语句 A
except Exception as e:
    执行语句 B
# raise NameError	# 一旦raise执行,raise后面的语句都不再执行
finally:
    执行语句 C

示例:

try:
    print(1 / 0)	# 1除以0 会报错
except Exception as e:
    print(e)
finally:
    print('SunriseCai')
# division by zero
# SunriseCai

常用模块

模块调用的方法:

方法 作用
import module 导入模块
import module as xx 将导入模块更名为xx
from module import xx 导入模块的xx函数
from module import xx as bb 将导入的模块函数xx更名为bb

time 模块

  • 休眠10秒:
import time
time.sleep(10)		# 此处Python程序会休眠10
  • 获取当前时间戳,即1970.01.01到现在经过了多少秒:
import time
print(time.time())	# 1578838874.4708762
  • 获取当前年月日:
import time

stamp = time.time()
print(time.strftime('%Y-%m-%d', time.localtime(stamp)))	# 2020-01-12
  • 获取当前年月日 时分秒
import time

stamp = time.time()
print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(stamp)))	# 2020-01-12 22:20:20

os 模块

  • os模块提供了非常丰富的方法用来处理文件和目录。常用的方法如下表所示:
方法 描述
os.listdir(path) 返回path指定的文件夹包含的文件或文件夹的名字的列表。
os.path.exists(path) 判断该文件(文件夹)存在与否
os.makedirs(path) 递归文件夹创建函数
os.removedirs(path) 递归删除目录。
os.rmdir(path) 删除path指定的空目录,如果目录非空,则抛出错误
os.remove(path) 删除路径为path的文件。如果path 是一个文件夹,将抛出错误

一般是os的这两个方法os.path.exists(path)os.path.exists(path) 用的最多。判断存在与否,然后做删除或者直接创建就完事了。

json 模块

  • json 模块主要用到一下两个方法:
函数 描述
json.dumps Python对象编码成 JSON 字符串
json.loads 将已编码的 JSON 字符串解码为 Python 对象

以上,是在Python爬虫中常用的很少一部分知识点。
会用到的知识点和模块有很多很多,这里只记一些用的最多的。


最后来总结一下本章的内容:

  1. 介绍了Python基本数据结构
  2. 介绍了占位符format()
  3. 介绍了条件语句循环语句异常处理
  4. 介绍了joinsplitstrip处理序列及字符串的用法
  5. 最后介绍了timeosjson模块的基本用法

sunrisecai

  • 感谢你的耐心观看,点关注,不迷路。
  • 为方便菜鸡互啄,欢迎加入QQ群组织:648696280

下一篇文章,名为 《Python爬虫从入门到放弃 03 | Python爬虫中的高级用法》

发布了39 篇原创文章 · 获赞 231 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/weixin_45081575/article/details/103947856