爬取彩票中奖信息 - 代码天地

爬取彩票中奖信息

其他 2019-12-07 21:01:21 阅读次数: 0

（1） http://www.zhcw.com/ssq/kaijiangshuju/index.shtml?type=0，打开此网址，并通过浏览器中“检查”选项发现此网页数据来源规律；

（2）发现他的这些信息都存在标签<tr>中

（3）代码展示：

爬取 1-5 页的中所有中奖的<开奖时间>、<期号>、<中奖号码>、<销售额>、 <一等奖>、 <二等奖>信息存储至 CSV 文件。

 #将信息爬取出来并存在列表中
form = []
for i in range(1,5):
    url1 = "http://kaijiang.zhcw.com/zhcw/html/ssq/list_%s.html" %(i)
    html1 = requests.get(url1).text
    soup = BeautifulSoup(html1, 'html.parser')
    tag = soup.find_all('tr')
    # print(tag)
    for a in tag[2:len(tag) - 1]:
        temp = []
        for b in a.contents[0:12]:
            if (b != '\n'):
                temp += [b.text.strip().replace('\r\n', '').replace(' ', '').replace('\n', ' ')]
        form.append(temp)

存到csv中：

with open('双色球中奖信息.csv','w',newline='',encoding='utf-8') as f:
    writer = csv.writer(f)
    writer.writerow(['开奖日期', '期号', '中奖号码', '销售额(元)', '一等奖', '二等奖'])
    for a in form:
        print(a)
        writer.writerow(a)

运行结果：

扫描二维码关注公众号，回复： 8106837 查看本文章

总结：

推荐使用lxml解析库，必要时使用html.parser
标签选择筛选功能弱但是速度快
建议使用find()、find_all() 查询匹配单个结果或者多个结果
如果对CSS选择器熟悉建议使用select()
记住常用的获取属性和文本值的方法

猜你喜欢

转载自www.cnblogs.com/wt714/p/12003239.html

爬取彩票中奖信息

爬取彩票信息(有空试下)

selenium登录实时爬取安徽快3彩票最新开奖信息

如何爬取每天的彩票数

简单彩票中奖实现-Demo

算法分析--彩票中奖问题

中奖彩票号码程序

爬取股票信息

帖子信息爬取

爬取酒店信息

Python爬虫彩票数据（120期）爬取

Python爬虫彩票数据（120期）爬取

python爬取彩票排列三开奖结果

【pwnable.kr】lotto - 彩票的中奖概率...

买一注彩票平均中奖的金额

java实现双色球彩票中奖游戏

（79）--爬取网页信息

python 爬取淘宝信息

爬取携程信息

豆瓣影评信息爬取

新浪股票信息爬取

爬取豆瓣电影信息

爬取阿里招聘信息

爬取拉钩网信息

beautiful爬取豆瓣信息

python爬取股票信息

链家信息爬取

爬取腾讯招聘信息

腾讯招聘信息爬取

QQ群信息爬取

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)