几个Python线程坑，和连接池的坑 - 代码天地

几个Python线程坑，和连接池的坑

其他 2019-08-07 14:01:25 阅读次数: 0

urlretrieve 没有超时，需要通过socket来设置

socket.setdefaulttimeout(10)

而且还需要为他设置连接池，所以直接改用requests来下载文件

def download_file(self, url, filename):
    r = self.session.get(url, stream=True)
    with open(filename, 'wb') as f:
        for chunk in r.iter_content(chunk_size=512):
            if chunk:
                f.write(chunk)

写原生爬虫遇到问题 can`t start new thread 自己的机器上一直没问题没发现，到了别人的机器上暴漏出来了。

原因是原生的thread在执行完成后并没有销毁退出,而是进入了sleeping状态，导致最后线程创建超出了允许的上限。其实通过修改Thread的初始化中的一些行为，可以使thread可以复用。

或者简单点，使用线程池来解决

from concurrent.futures.thread import ThreadPoolExecutor

def thread_run(target, args_list, max_thread=12):
    with ThreadPoolExecutor(max_thread) as executor:
        for arg in args_list:
            executor.submit(target, arg)

还有一个问题就是 Connection pool is full, discarding connection

可以进行如下设置

session.mount(prefix='', adapter=HTTPAdapter(pool_connections=1, pool_maxsize=36, max_retries=1))

但是在多线程情况下还是会出现 pool is full。我把maxsize设置的比 threads数稍大一点时，就没有warning了，也可能是我代码还有隐藏的问题。

也可能跟线程池有关，暂时没看线程池的源码，如果这样可以通过信号量来加锁

from threading import Semaphore

class AA():
    sem = Semaphore(12)
    
    ...

    def getHtml():
        sem.acquire()
        session.get()
        sem.release()

猜你喜欢

转载自www.cnblogs.com/wrnmb/p/11314660.html

几个Python线程坑，和连接池的坑

Druid连接池的坑

Druid连接池默认配置和坑

httpclient连接池相关参数的坑

连接池和线程

线程池和连接池的区别

聊聊连接池和线程

性能测试：连接池和线程

转聊聊连接池和线程

springboot之ActiveMQ连接池【踩坑】

阿里Druid连接池监控的两个坑

tomcat7使用dbcp连接池遇到的坑

使用druid连接池带来的坑testOnBorrow=false

Druid连接池监控的两个坑

【坑】mysql 8.0以后的驱动 jar、连接池的变化

EFCore连接池的坑差点晚年不保

JDBC：使用Druid连接池掉入的坑

连接池/线程池

线程池与连接池

生产环境连接池和线程池配置参考

线程池的原理和连接池的原理

Java爬虫入门(四)——线程池和连接池

数据库连接池和线程池

对象池、连接池、线程池

多线程连接池

几个主流的Java连接池整理

10.线程池与连接池

mybatis连接池与线程池

池——线程池、进程池、内存池、连接池

高并发技术之数据库连接池设计与实现|为什么要用连接池？连接池原理揭秘 |连接池实现过程中的那些坑

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)