python爬虫实践——爬取豆瓣书本头250

转载自https://blog.csdn.net/MTbaby/article/details/79174036

#-*- coding:utf-8 -*-
import requests
from lxml import etree
import time

url = 'https://book.douban.com/top250'
data = requests.get(url).text
f = etree.HTML(data)
books = f.xpath('//*[@id="content"]/div/div[1]/div/table/tr/td[2]/div[1]/a/@title')
for book in books:
    print ("书名:",book)

返回结果 

C:\Users\cathy\AppData\Local\Programs\Python\Python37\python.exe E:/PythonProject/doubantop350.py
书名: 追风筝的人
书名: 解忧杂货店
书名: 小王子
书名: 白夜行
书名: 围城
书名: 三体
书名: 嫌疑人X的献身
书名: 挪威的森林
书名: 百年孤独
书名: 红楼梦
书名: 看见
书名: 不能承受的生命之轻
书名: 活着
书名: 达·芬奇密码
书名: 平凡的世界(全三部)
书名: 三体Ⅱ
书名: 三体Ⅲ
书名: 简爱(英文全本)
书名: 我们仨
书名: 天才在左 疯子在右
书名: 哈利·波特与魔法石
书名: 傲慢与偏见
书名: 明朝那些事儿(壹)
书名: 目送
书名: 飘

Process finished with exit code 0

猜你喜欢

转载自blog.csdn.net/muzhiqian/article/details/85161251