python实现将图片数据以LMDB方式存储 - 代码天地

python实现将图片数据以LMDB方式存储

企业开发 2024-01-08 21:42:08 阅读次数: 0

以LMDB（Lightning Memory-Mapped Database）方式存储的优点

高效性：LMDB是一种内存映射数据库，可以在内存和磁盘之间实现高效的数据访问。它利用操作系统的虚拟内存机制，将数据文件映射到内存中，从而避免了频繁的磁盘IO操作，提高了数据的读取和写入效率
低内存占用：LMDB使用了页面缓存和写时复制（Copy-on-Write）的技术，可以在内存中保持数据的快速访问同时占用较少的内存空间。这对于处理大规模数据集或内存有限的环境非常有用
并发支持：LMDB支持多线程或多进程的并发读取和写入操作，可以在高并发的数据访问场景下保持数据的一致性和可靠性
数据压缩：LMDB支持数据的压缩，可以减小数据文件的大小，节省存储空间
跨平台兼容：LMDB是一个跨平台的数据库，可以在不同的操作系统上使用，并提供了多种编程语言的接口，如C、Python等

代码示例

将目标分类的数据存储成“.lmdb”文件，

import pickle, lmdb
from tqdm import tqdm


img_paths = []
images, labels = [], []
for img_path in img_paths:
    images.append(img_path)
    labels.append(1)  ## 假设数据的label为1


combined = list(zip(images, labels))
random.shuffle(combined)
images, labels = zip(*combined)
images = list(images)
labels = list(labels)


def create_lmdb(images, labels, lmdb_path):
    assert len(images) == len(labels), "All lists must have the same length"

    db = lmdb.open(lmdb_path, map_size=int(1e12))

    with db.begin(write=True) as txn:
        bar = tqdm(images)
        for i, img_path in enumerate(bar):
            with open(img_path, 'rb') as f:
                img_data = f.read()

            meta_data = {'label': labels[i], 'size': len(img_data)}
            data = pickle.dumps((meta_data, img_data))
            txn.put(str(i).encode('utf-8'), data)
        
        txn.put('length'.encode('utf-8'), str(len(img_paths)).encode('utf-8'))

    print(f"Created LMDB dataset at {lmdb_path} with {len(img_paths)} images")


create_lmdb(images=images, labels=labels, lmdb_path="xxx.lmdb")

猜你喜欢

转载自blog.csdn.net/qq_38964360/article/details/134099340

python实现将图片数据以LMDB方式存储

python实现将图片数据以TFRecord方式存储

ssh 实现将大量数据以cvs格式导出

Python实现将图片插入MySQL数据库

【python】将json串写入文件,并以json格式读取出来 python实现将json数据以json格式写入txt文件 python读写json文件

Python实现将图片转字符画

python 实现将视频转换为图片

ses数据以节点方式进行存储的问题

python3实现的json数据以HTTP GET,POST,PUT,DELETE方式页面请求

在Android中使用SharedPreferences存储数据以实现数据共享

Java Web程序实现将String类型数据转换成JPG图片并存储在文件夹中

python实现按照给定范围随机生成小数，偶数，奇数，整数，正态分布，均匀分布数据以及图片

caffe-图片转为lmdb数据集

Python实现将图片以二进制格式保存到MySQL数据库中，以及取出：

Python存储数据的方式

python 存储数据的方式

Python 数据存储 ----＞方式

python实现将彩色图片转化为字符图片（即图片由字符组成）

使用python操作lmdb对数据读取

python中读写LMDB数据库

python实现将多张图片结合为一张图片的方法

Python爬虫 - 将爬取数据以JSON格式存储与读取

jsp实现将图片与文字同时上传

Java实现将文件(图片)上传到七牛云对象存储，并实现下载和删除功能

实现将登陆信息存储在redis数据库中

存储过程——实现将查询出的数据作为列新建表

Python之数据存储方式

用Python实现将一张图片分成9宫格

python批量实现将文件夹内的每张图片分割成多张

python实现将图片添加水印并设置为桌面背景

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)