【urllib___】笔趣阁(抓取部分) - 代码天地

【urllib___】笔趣阁(抓取部分)

其他 2018-06-13 19:52:46 阅读次数: 2

 1 url='http://www.biquge.info/10_10218/' #定义网址
 2 UA={"User-Agent":"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"}#定义协议
 3 import time,lxml
 4 from lxml import etree
 5 from urllib.request import Request
 6 from urllib.request import urlopen
 7 import os
 8 #c=os.path.join(os.path.abspath(os.path.dirname(__name__)),'1.html')#写到本地读入
 9 #with open(c,'r') as f:
10 #   a=f.read()
11 def source(url):#写入到本地的网页源代码
12    global UA
13    print(UA)
14    text=urlopen(Request(url,None,UA),timeout=5)
15    return text.read()
16 
17 def respon(text):#xpath到各个章节的链接地址
18    global url
19    seletor=etree.HTML(text)
20    url1=seletor.xpath("//*[@id='list']/dl/dd/a/@href")
21    name=seletor.xpath("//*[@id='list']/dl/dd/a/text()")
22    for i in range(len(url1)):
23        print(url+url1[i],name[i])
24 a=source(url)
25 respon(a)

特别需要注意的是UA在Request中传值会出现错误，这时需要耐心来把问题解决

猜你喜欢

转载自www.cnblogs.com/Skyda/p/9179420.html

【urllib___】笔趣阁(抓取部分)

笔趣阁

笔趣阁的小说爬取

爬取笔趣阁小说

Python 爬取笔趣阁小说

笔趣阁单篇小说采集

笔趣阁小说优化版

scrapy框架爬取笔趣阁

python爬取笔趣阁小说

Python爬虫——从笔趣阁爬小说

scrapycrawl 爬取笔趣阁小说

爬取笔趣阁网站小说

爬取笔趣阁文章

爬虫练习——爬取笔趣阁

Python爬虫练习二：爬取笔趣阁小说

爬取笔趣阁小说（一念永恒）

用Scrapy爬取笔趣阁小说

笔趣阁小说 python3爬虫实例

scrapy框架爬取笔趣阁完整版

分享笔趣阁、宜搜等小说免费API接口

学习笔记（爬虫）：爬取笔趣阁小说

网络爬虫之笔趣阁小说搜索下载

爬取笔趣阁_完本书籍（未完）

用Python实现笔趣阁小说爬取

java爬虫爬取笔趣阁小说

python爬虫--小说爬取--笔趣阁篇

Python3中BeautifulSoup爬取笔趣阁小说网

python3.6.5爬虫之四：多线程同时爬取笔趣阁小说

python3.6.5爬虫之一：笔趣阁小说爬取（首页爬取法）

笔趣阁（www.qu.la）小说爬取代码（python实现）

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)