爬虫基础（二） - 代码天地

爬虫基础（二）

其他 2019-04-14 22:40:59 阅读次数: 0

2.1 Session

2.2 Cookie

2.3 爬取丁香园论坛的回复内容

'''
爬取丁香园论坛的回复内容
'''

import requests
from pyquery import PyQuery as pq

BASE_URL = 'http://www.dxy.cn/bbs/thread/626626#626626'


def get_replies():
    html = requests.get(BASE_URL).text
    print('html', html)
    doc = pq(html)
    tds = doc('td.postbody').items()
    replies = [td.text().strip() for td in tds if td.text().strip()]
    print('一共有' + str(len(replies)) + '条回复')
    return replies


if __name__ == '__main__':
    replies = get_replies()
    for reply in replies:
        print(reply)

猜你喜欢

转载自blog.csdn.net/the_harder_to_love/article/details/89163927

爬虫基础入门（二）

爬虫基础二

爬虫基础（二）——网页

爬虫基础(二)

爬虫基础（二）

python | 爬虫笔记（二）- 爬虫基础

python爬虫笔记（二）爬虫基础

Python爬虫入门二之爬虫基础了解

Python爬虫小白——（二）爬虫基础——Selenium PhantomJS

爬虫基础(二)-----爬虫数据解析的三种方式

网络爬虫基础之二（requests）

Python实现网络爬虫基础学习（二）

爬虫框架urllib 之(二) --- urllib基础

java网络爬虫基础学习（二）

Python爬虫基础教程（二）

Python爬虫入门基础学习（二）

爬虫，简单爬虫基础！

[爬虫01]爬虫基础

爬虫基础

爬虫基础

基础爬虫

爬虫----基础

爬虫基础实战二（封装抓取网页代码）

Python爬虫第二篇--基础篇

python爬虫基础教程：requests库（二）

python爬虫基础教程：urllib库（二）

Python爬虫基础（二）--beautifulsoup-美丽汤框架介绍

小白学 Python 爬虫（12）：urllib 基础使用（二）

爬虫基础（二）正则表达式

面向零基础小白的爬虫系列（二）：列表与元组

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

慧测学习课件

Mscordacwks.dll/SOS.dll 调试归档

关于深度学习人工智能模型的探讨（二）（7）

Stop Using the text-indent:-9999px

Least Common Multiple（HDU - 1019 ）

Comparator接口的使用方法--例子

修改framework Camera的API,旋转摄像头

机器学习时代的“大数据+”：数据平台的设计与搭建

vue 项目部署到nginx

webstorm 常用插件集合

每日归档

更多

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)