python 一个简单的爬取程序

版权声明:孤 https://blog.csdn.net/Wu000999/article/details/82346277

代码: first_get.py


#引入requests模块
import requests

#定义get_content函数
def get_content(url):
    resp = requests.get(url)
    return resp.text

#定义url,值为要抓取的目标站网址
url = "http://www.baidu.com"

#调用函数返回值给content
content = get_content(url)

#打印输出content
print("网页为:\n ",content)

#得到content的长度
content_len = len(content)
print("内容的长度: ",content_len)

#判断内容长度是否大于40kB
if content_len >= 40 * 1024:
    print("内容的长度大于等于40kB.")
else:
    print("内容的长度小于等于40kB.")

# 用于单行注释

    resp = requests.get(url)

requests支持get和post方法, requests的get和post方法在发出请求并得到响应后,后返回一个响应对象,这里将响应对象赋给resp

 return resp.text

将获得resp对象的text属性,并将此属性作为函数的返回值返回。resp是一个对象,python支持面向对象程序设计,text是resp的一个属性,可以的得到相应的文本信息, 在python中可以通过 “.” 得到对象的属性或调用对象的方法。

猜你喜欢

转载自blog.csdn.net/Wu000999/article/details/82346277