python的multiprocessing模块踩坑记录 - 代码天地

python的multiprocessing模块踩坑记录

其他 2018-11-12 09:01:14 阅读次数: 0

前言

最近做多进程多IP爬虫，用到的multiprocessing模块有点坑，这里总结一下，python版本是3.6

踩坑记录

1、multiprocessing模块的子进程是不会复制父进程的数据的，这和fork函数不一样，子进程中不会有父进程中的变量，如果子进程执行的函数所需要的参数比较多，并且会有一系列函数嵌套调用，建议把子进程需要调用的全部函数与变量封装成一个类，直接将类的实例传递给子进程即可，例如：

class crawler:
     
    一系列属性
    一系列函数

    def run(self):
        主体函数

cr=crawler(.......一系列属性的初始值)
pool = multiprocessing.Pool(10) 
for i in range(0,10):
    pool.apply_async(crawler.run,(cr,))

这种形式需要注意是不是有临界资源存在，若有，记得在使用前上锁

2、子进程抛出的异常不会自动输出到控制台，需要我们自己捕获异常，输出到控制台或是日志

3、部分IDE对multiprocessing不是很支持，建议使用命令行直接运行对应python脚本

另外，本次爬虫的多IP不是指使用代理，而是通过DNS解析获得网站在不同地区的服务器IP地址，将域名直接改为IP地址，并在http请求头添加host字段，自己在处理京东时，发现使用https协议时，即使添加了host字段，京东的主机还是不认请求，改为http即可使用，这个有点神奇

猜你喜欢

转载自blog.csdn.net/dhaiuda/article/details/83860897

python的multiprocessing模块踩坑记录

Python踩坑记录

【Python】踩坑记录

python的multiprocessing的坑

python中multiprocessing模块

python-multiprocessing模块

【python】multiprocessing模块

python multiprocessing模块介绍

Python 模块 | multiprocessing

【python小随笔】进程池 multiprocessing.Pool的简单实现与踩过的坑

python踩坑记录篇，持续更新

Python Sphinx使用踩坑记录

python 多进程 Multiprocessing 模块

Python 多进程 -- multiprocessing 模块

python 多进程multiprocessing 模块

Python多进程模块multiprocessing

Python(多进程multiprocessing模块)

Python中的进程multiprocessing模块

Python之multiprocessing模块的使用

vue3 用vuex 模块划分踩坑记录

canvas 踩坑记录

Linux 踩坑记录

ReactNative踩坑记录

QT踩坑记录

OrientDB 踩坑记录

Echarts踩坑记录

icon踩坑记录

duilib踩坑记录

vue踩坑记录

node踩坑记录

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)