爬虫-通用代码框架 - 代码天地

爬虫-通用代码框架

其他 2019-03-24 00:58:05 阅读次数: 0

1.百度搜索关键词提交

百度的搜索路径格式是：http://www.baidu.com/s?wd=keyword

import requests
keyword = "Python"
try:
    kv = {'wd': keyword}
    url = "http://www.baidu.com/s"
    r = requests.get(url, params=kv) 　　# 在url尾部插入对应搜索关键词
    # print(r.request.url)
    r.raise_for_status()
    # print(len(r.text))
catch:
    print("爬取失败")

2.网络图片爬取

import requests
import os

root = "D://pics//"
url= "http://img0.dili360.com/ga/M01/43/32/wKgBy1diUTyAJgSmADRkvfSqZo0372.tub.jpg"
path = root + url.split('/')[-1]　　　　# 用网站图片名作为存储文件名
try:
　　if not os.path.exists(root):　　　　# 如果存储目录不存在则创建
　　　　os.mkdir(root)
　　if not os.path.exists(path):　　　　
　　　　r = requests.get(url)
　　　　with open(path, 'wb') as f:
　　　　　　f.write(r.content)
　　　　　　f.close()
　　　　　　print("保存成功")
　　else:
　　　　print("文件已存在")
except:
　　print("爬取失败")

3.提交IP地址到IP138查询

import requests
import os

ip = "202.204.80.112"
raw_url = ''http://www.ip138.com/ips138.asp?ip="
url = raw_url + ip
try:
　　r = requests.get(url)
　　r.raise_for_status()
　　r.encoding = r.apparent_encoding
　　print(r.text[-500:])
except:
　　print("爬取失败")

猜你喜欢

转载自www.cnblogs.com/KrianJ/p/10586571.html

爬虫-通用代码框架

Python 爬虫通用代码框架

Python网络爬虫(1)——Requests及爬虫通用代码框架

python爬虫通用框架

爬虫通用框架

人生苦短之爬虫爬取网页的通用代码框架

爬虫爬取网页的通用代码框架（附实例）

Python——网络爬虫，一个简单的通用代码框架

（转）Python爬虫--通用框架

通用爬虫框架及heritrix爬虫介绍

网络爬虫之Requests库及爬取网页的通用代码框架

Scrapy框架的使用之Scrapy通用爬虫

分布式通用爬虫框架Crawlab

Scrapy框架: 通用爬虫之SitemapSpider

Scrapy框架: 通用爬虫之XMLFeedSpider

Scrapy框架: 通用爬虫之CSVFeedSpider

Scrapy框架: 通用爬虫之CrawlSpider

Scrapy框架实战（五）：通用爬虫 CrawlSpider

基于scrapy与xslt的通用爬虫框架

Python爬虫代码框架

爬虫代码框架

爬虫(十八)：Scrapy框架(五) Scrapy通用爬虫

2.零基础系统学习Python爬虫之爬取网页的通用代码框架

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

python爬取网页的通用代码框架

基于tensorflow的机器学习通用代码框架

python 爬取网页的通用代码框架

爬取网页的通用代码框架

通用图像融合框架论文及代码整理

通用爬虫

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)