python爬取分析超级大乐透历史开奖数据 - 代码天地

python爬取分析超级大乐透历史开奖数据

企业开发 2021-02-26 00:12:56 阅读次数: 0

python爬取分析超级大乐透历史开奖数据

博主作为爬虫初学者，本次使用了requests和beautifulsoup库进行数据的爬取

爬取网站：http://datachart.500.com/dlt/history/history.shtml —500彩票网
（分析后发现网站源代码并非是通过页面跳转来查找不同的数据，故可通过F12查找network栏找到真正储存所有历史开奖结果的网页）

如图：在这里插入图片描述 爬虫部分：

from bs4 import BeautifulSoup   #引用BeautifulSoup库
import requests                 #引用requests
import os                       #os
import pandas as pd
import csv
import codecs

lst=[]
url='http://datachart.500.com/dlt/history/newinc/history.php?start=07001&end=21018'
r = requests.get(url)                     
r.encoding='utf-8'
text=r.text
soup = BeautifulSoup(text, "html.parser")
tbody=soup.find('tbody',id="tdata")
tr=tbody.find_all('tr')
td=tr[0].find_all('td')
for page in range(0,14016):
    td=tr[page].find_all('td')
    
    lst.append([td[0].text,td[1].text,td[2].text,td[3].text,td[4].text,td[5].text,td[6].text,td[7].text])
    with open("Lottery_data.csv",'w') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['期号','号码1', '号码2', '号码3', '号码4', '号码5', '号码6', '号码7'])
        writer.writerows(lst)
csvfile.close()

数据分析：
首先展示所有的彩票期号以及相应的中奖数字
在这里插入图片描述

而后通过5+2的模式分别初步分析最高频次的两组数据组合，比较模糊的计算出了本组合中奖概率为平均中奖几率的3倍（最终结果不直接展示而是在csv文件中以红色标明）
在这里插入图片描述
源代码以及相应csv文件
链接：https://pan.baidu.com/s/16wEHnpvrzMsK1ijW0AkhiA
提取码：nmjx

tips：感谢大家的一键三连~另外，有不足之处大可向博主当面指出！！

猜你喜欢

转载自blog.csdn.net/xucan_123/article/details/113943714

python爬取分析超级大乐透历史开奖数据

Python爬取大乐透

scrapy框架爬取大乐透数据

带你爬取双色球历史开奖信息并作可视化分析

python 爬取中彩网双色球开奖数据，预测下一期开奖号码

记录一下使用nodejs爬取双色球历史开奖数据并写入文件过程，仅自己做着玩玩

python简易的大乐透数据获取及初步分析

Python爬取微信公众号历史文章进行数据分析

python爬取历史天气

python爬取彩票排列三开奖结果

python爬取天气网历史数据

python爬取数据分析

python爬取电影历史票房Top480并进行数据分析及其可视化

scrapy 抓取体彩-超级大乐透，历年开奖号码【娱乐篇】

python爬虫爬取厦门历史天气

爬虫：爬取股票历史交易数据

python数据爬取

python爬取数据

【爬虫】爬取某彩票网站的历史数据，并进行分析

Python爬取竞彩网每场比赛的开奖结果中的详细信息

通过Python五秒爬取四十万的数据！屌不屌？爬取并分析！

2018-7-12python爬取历史天气数据

python爬虫爬取各个城市历史天气及数据可视化

用Python爬虫获取疫情相关信息2(爬取历史总数据)

Python爬取香港交易所HKEX沪深港通历史持股数据

如何用Python爬取创业板历史+实时股票数据！

使用Python爬取网站数据分析

Python爬取拉勾网数据分析职位

用Python爬取分析全国旅游数据

python爬取拉勾职位数据并对其进行分析

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)