爬虫小demo - 代码天地

爬虫小demo

其他 2022-04-27 20:42:43 阅读次数: 0

为准备大数据课设学习爬虫小项目,现在网上学习爬虫中商情报局
代码罗列如下，以备回顾

from urllib.parse import urlencode
import requests
from bs4 import BeautifulSoup
import pandas as pd
data = []
#1.url
#https://s.askci.com/stock/a/0-0?reportTime=2017-12-31&pageNum=2#QueryCondition
for i in range(1,10):
  paras = {
    
    
    'reportTime=':'2017-12-31',
    'pageNum': i
  }
  695185429
  url = 'https://s.askci.com/stock/a/0-0?' + urlencode(paras)
  print(url)

  # 2.请求资源,获取响应
  # response = requests.get(url)#这个网站不需要请求头
  # #print(response.text)
  # html = response.text
  
 #3.解析网页 工具 正则 xpath bs4  # , html ,解析库
  #第一种
  # soup = BeautifulSoup(html,'lxml')#规范化
  # #print(soup)
  #
  # tr_list = soup.find_all('tbody')
  # for data in tr_list:
  #   print(data)
  #   print(data.text.split())#只获得文字信息

  #第二种
  tb = pd.read_html(url,header=0)[3]#表
  print(tb.head())



  #数据保存  数据库
  #tb.to_csv('1.csv')
  data.append(tb)

df =pd.concat(data)
df.to_csv('2.csv')

原网站
在这里插入图片描述
运行结果：

在这里插入图片描述

注：因此网站没有反爬机制，所以网上很多关于中商的例子，很不错

猜你喜欢

转载自blog.csdn.net/qq_30336973/article/details/116674419

爬虫小demo

Scrapy爬虫小demo总结

基于Webmagic框架的爬虫小Demo

爬取腾讯信息的小爬虫demo

Python多线程爬虫小demo

爬虫_demo

jsoup爬虫简书首页数据做个小Demo

Python爬虫：爬虫demo

小demo

【python爬虫】python爬虫demo

Jsoup爬虫 demo

java爬虫demo

爬虫demo_草稿

python 爬虫demo

框架基础_爬虫demo

小爬虫demo——爬取“妹子”等网站链接____使用requests库

小爬虫

angularJs小Demo

Netty小demo

SpringMvc的小Demo

dwr 小demo

junit测试小demo

Dubbox的入门小demo

PHPexcel 应用小DEMO

vue项目小demo

NodeJs的小Demo

angular入门小demo

swift 小 demo

C#小demo

Hibernate框架小demo

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)