requests库访问网站 - 代码天地

requests库访问网站

其他 2020-05-19 13:40:40 阅读次数: 0

 1 import requests
 2 from bs4 import BeautifulSoup
 3 alluniv = []
 4 def getHTMLText(url):
 5     try:
 6         r = requests.get(url,timeout = 30)
 7         r.raise_for_status()
 8         r.encoding = 'utf-8'
 9         return r.text
10     except:
11         return "error"
12 def xunhuang(url):
13      for i in range(20):
14          getHTMLText(url)
15 def fillunivlist(soup):
16     data=soup.find_all('tr')
17     for tr in data:
18         ltd =tr.find_all('td')
19         if len(ltd)==0:
20             continue
21         singleuniv=[]
22         for td in ltd:
23             singleuniv.append(td.string)
24         alluniv.append(singleuniv)
25 def printf():
26      print("\n")
27      print("\n")
28      print("\n")
29 def main():
30      url = "http://www.google.com"
31      html=getHTMLText(url)
32      xunhuang(url)
33      print(html)
34      soup=BeautifulSoup(html,"html.parser")
35      fillunivlist(soup)
36      print(html)
37      printf()
38      print(soup.title)
39      printf()
40      print(soup.head)
41      printf()
42      print(soup.body)
43 main()

猜你喜欢

转载自www.cnblogs.com/double-star/p/12916367.html

requests库访问网站

爬虫初级用requests库访问某个网站20次 33号

requests使用代理访问国外网站

requests库爬取需要登录的网站

requests库的方法和控制访问参数

python 访问网站时报错：requests.exceptions.SSLError: HTTPSConnectionPool

requests库-忽略不安全的网站并且忽略警告

Requests库

requests 库

python中requests模块有些网站不能访问解决方案

requests 抓取网站

小爬虫demo——爬取“妹子”等网站链接____使用requests库

Python使用requests库模拟登陆网站的方式--以豆瓣为例

【python】py35中使用requests库爬https协议下的网站

python爬虫学习，使用requests库来实现模拟登录4399小游戏网站。

利用python的requests和BeautifulSoup库爬取小说网站内容

实战：如何通过python requests库写一个抓取小网站图片的小爬虫

requests库登录网站，Session()和session()差一个大小写非常要命

Python3 使用requests库读取本地保存的cookie文件实现免登录访问

requests库中session实现共享cookie访问人人网

requests库常用到的7个主要方法及控制访问参数

requests使用cookie登录网站

网站访问人数统计(连接数据库)

网站访问量大怎样优化mysql数据库

requests使用代理IP访问

python爬虫学习第二天，利用BeautifulSoup库和Requests库爬取网站

requests请求库

python requests请求库

Requests 库学习

爬虫基础——requests库

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)