使用 python 读取图像数据，提高数据预处理速度 - 代码天地

使用 python 读取图像数据，提高数据预处理速度

其他 2019-03-15 22:31:00 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u012193416/article/details/87531272

import cv2
import time
import glob

'''
首先需要从处理内容的文件列表开始
使用 for 循环逐个处理每个数据，然后在每个循环迭代上运行预处理
'''
# loop through all jpg file in the current folder
# resize each one to size 600*600
start_time = time.time()
for image_filename in glob.glob('./Airport/*.jpg'):
    img = cv2.imread(image_filename)

    # resize the image
    img = cv2.resize(img, (600, 600))
print('time:', time.time() - start_time)
# 2.667  360 jpgs

'''
将 jpg 文件列表分成4个小组
运行 python 解释器中的 4 个独立的实例
让 python 的每个实例处理 4 个数据小组中一个
结合 4 个处理过程得到的结构得出最终那那个结果列表
'''
import concurrent.futures

start_time1 = time.time()


def load_and_resize(image_filename):
    img = cv2.imread(image_filename)
    img = cv2.resize(img, (600, 600))


# create a pool of processes. By default,one is created for each cpu in your machine
with concurrent.futures.ProcessPoolExecutor() as executor:
    # get a list of files to process
    image_files = glob.glob('*.jpg')

    # executor.map() 将你想要运行的函数和列表作为输入，列表中的每个元素都是我们函数的单个输入，由于我们有6个核，我们将同时处理该列表中的6个项目
    executor.map(load_and_resize, image_files)

print('acceleration time:', time.time() - start_time1)
# 0.139

使用数据集一共 360 张图片，采用第一种方法，for 循环大概 2.667s，第二种方法，利用多核并行

with concurrent.futures.ProcessPoolExecutor() as excutor
    executor.map()

大概是 0.139s，比第一种方法快一倍。

猜你喜欢

转载自blog.csdn.net/u012193416/article/details/87531272

使用 python 读取图像数据，提高数据预处理速度

三行Python代码，让数据预处理速度提高2到6倍

python数据预处理：使用pandas 进行数据清洗

入门｜三行Python代码，让数据预处理速度提高2到6倍 python入门

python 使用scikit-learn对数据进行预处理

【 python 】 —— 数据预处理：(2) 数据的保存与读取

Python数据预处理

使用Python与openpyxl进行表格处理（一）——读取数据

Python使用库读取数据

python出租车轨迹数据预处理之二——文件批量处理及try的使用

使用Python爬取网站数据并进行图像处理

Python数据预处理：使用Dask和Numba并行化加速

python中读取栅格数据_使用rasterio处理python中的地理空间栅格数据

python数据预处理练习

Python数据预处理总结

python数据预处理for knn

Python-数据预处理

Python做数据预处理

python数据预处理（入门）

python 数据预处理1

使用python处理缺失数据

使用Python处理JSON数据

python 图像预处理

使用Python读取和处理安卓传感器数据与CSV读取

数据预处理速度高倍提升，3行python代码简单搞定！

如何用Python将数据预处理速度提升2至6倍？

数据预处理 Python主要数据预处理函数

Cython（提高Python的速度）的简单使用

【Python】使用python处理excel表格数据

数据预处理：读取文件数据，并存为python数组

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)