import pandas as pd
import numpy as np
from pandas import DataFrame as df
import os
import math
import keras
from keras.preprocessing import image
from keras.applications.resnet50 import preprocess_input
from keras.utils import np_utils, Sequence
from sklearn.model_selection import StratifiedShuffleSplit
- Quando cabeçalho = None, que não é especificado no índice da coluna dados do arquivo original, então read_csv para adicionar automaticamente um índice de coluna, a menos que você é dado o nome do índice da coluna.
- cabeçalho = 0, representa a primeira linha da linha de cabeçalho
root=r'C:\Users\liulu\Desktop\huaweicloud\file\train_data\train_data'
file_folder=r'C:\Users\liulu\Desktop\huaweicloud\file\train_data\train_data'
img_path = [] # 每张图片的路径
labels = [] # 每张图片的标签
csv = pd.read_csv(r"C:\Users\liulu\Desktop\huaweicloud\file\train.csv",header=0)
for index in csv.index:
image = str(csv.loc[index].values[0])
label = int(csv.loc[index].values[1])
image_name = os.path.join(file_folder, image)
img_path.append(image_name)
labels.append(label)
print(len(img_path),len(labels))
Agora, a necessidade conjunto de treinamento para encontrar o seu conjunto de validação do caminho são as imagens, correspondente ao rótulo e, em seguida, pode ser embalado em uma função
def get_data(label_file): #从csv文件中读取图片路径和标签
img_paths=[]
labels=[]
csv=pd.read_csv(label_file,header=0) #===0000????
csv=csv.sample(frac=1.0) #csv是一个数据框,csv.loc[index]是一个series,.value得到array
for index in csv.index:
image=str(csv.loc[index].values[0])
label=int(csv.loc[index].values[1])
image_name=os.path.join(file_folder,image)
img_paths.append(image_name)
labels.append(label)
return img_paths,labels
train_img_paths,train_labels=get_data(train_label_file) #get训练csv得到图片路径列表,标签列表
val_img_paths, val_labels = get_data(val_label_file)