python数据爬虫示例一 - 代码天地

python数据爬虫示例一

其他 2018-05-29 18:47:19 阅读次数: 0

 
  import  
  requests

 
  from 
  bs4  
  import  
  BeautifulSoup 
 

 
  import  
  bs4

 
  def  
  getHTMLText(url):

 
  try 
  :

 
          r=requests.get(url, 
  timeout 
  = 
  30 
  ) 
 

 
  r.raise_for_status() 
 

 
          r.encoding=r.apparent_encoding 
 

 
  return 
  r.text

 
  except 
  :

 
  return 
  "exception"

 
  def  
  fillUniveList(ulist,html):

 
      soup=BeautifulSoup(html, 
  "html.parser" 
  ) 
 

 
      
  for 
  tr 
  in 
  soup.find( 
  'tbody' 
  ).children: 
 

 
  if 
  isinstance 
  (tr,bs4.element.Tag):

 
              tds=tr( 
  'td' 
  ) 
 

 
              ulist.append([tds[ 
  0 
  ].string,tds[ 
  1 
  ].string,tds[ 
  3 
  ].string]) 
 

 
  def  
  printUnivList(ulist,num):

 
    
  print 
  ( 
  "{:^10} 
  \t 
  {:^6} 
  \t 
  {:^10}" 
  .format( 
  "排名" 
  , 
  "学校名称" 
  , 
  "总分" 
  )) 
 

 
    
  for 
  i 
  in  
  range 
  (num): 
 

 
        u=ulist[i] 
 

 
        
  print 
  ( 
  "{:^10} 
  \t 
  {:^6} 
  \t 
  {:^10}" 
  .format(u[ 
  0 
  ],u[ 
  1 
  ],u[ 
  2 
  ])) 
 

 
    
  print 
  ( 
  "Suc" 
  + 
  str 
  (num)) 
 

 
  def  
  main():

 
      unifo=[] 
 

 
      url= 
  "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html"

 
  html=getHTMLText(url)

 
      fillUniveList(unifo,html) 
 

 
      printUnivList(unifo, 
  20 
  ) 
 

 
  main() 
 

猜你喜欢

转载自blog.csdn.net/c11611/article/details/72718525

python数据爬虫示例一

python爬虫基本示例

python爬虫示例

Python学习：爬虫示例

python 爬虫入门示例

doraemon的python 爬虫示例1（入门）动态数据的爬取

Python|爬虫和测试|selenium框架模拟登录示例（一）

[python]书籍信息爬虫示例

python 爬虫urllib基础示例

Python学习(20)：爬虫示例

Python爬虫——Get请求示例

Python爬虫——Post请求示例

python 进阶版（爬虫示例）

python爬虫(一)_爬虫原理和数据抓取

python网络爬虫及数据抓取（一）

Python网络爬虫之数据解析（一）

python爬虫示例爬取网页信息，并且将爬取到的信息存入数据库。

Python爬虫案例解析：五个实用案例及代码示例（学习爬虫看这一篇文章就够了）

python 爬虫示例，方便日后参考

Python beautifulsoup+requets爬虫示例

基于Python框架Scrapy爬虫示例

Python爬虫—多线程的简单示例

Python多线程爬虫简单示例

Python 多线程爬虫通信示例

Python爬虫-视频爬取示例

python爬虫简单架构原理及示例

python多协程爬虫示例

Python爬虫：Selenium的介绍及简单示例

python 爬虫（一） requests+BeautifulSoup 爬取简单网页代码示例

第一个python爬虫示例——爬取天气信息

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)