评估深度学习模型-在keras中使用scikit-learn-基于keras的python学习笔记(三)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_44474718/article/details/86249827

使用交叉验证评估模型

KerasClassifier和kerasregressor
类使用参数build_fn,指定用来创建模型的函数的名称。因此,必须定义一个函数,并通过函数来定义深度学习的模型,编译并返回它。在下面的例子中,定义了利用create_model()函数来创建一个简单的多层神经网络。

函数解释:

 cross_val_score(estimator, 
                    X, 
                    y=None,
                    groups=None, 
                    scoring=None,
                    cv=None, 
                    verbose=0, 
                    fit_params=None,
                    pre_dispatch='2*n_jobs')

estimator:选用的学习器的实例对象,包含“fit”方法;
X :特征数组
y : 标签数组
groups:如果数据需要分组采样的话
scoring :评价函数
cv:交叉验证的k值,当输入为整数或者是None,估计器是分类器,y是二分类或者多分类,采用StratifiedKFold 进行数据划分文本
fit_params:字典,将估计器中fit方法的参数通过字典传递

keras.wrappers.scikit_learn.KerasClassifier(build_fn=None, **sk_params), 这实现了Scikit-Learn 分类器接口,
keras.wrappers.scikit_learn.KerasRegressor(build_fn=None, **sk_params), 这实现了Scikit-Learn 回归接口。

参数

build_fn: 可调用函数或类实例
sk_params: 模型参数和拟合参数
参考keras中文帮助文档:https://keras.io/zh/scikit-learn-api/#_1

from keras.models import Sequential
from keras.layers import Dense
import numpy as np
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import StratifiedKFold
from keras.wrappers.scikit_learn import KerasClassifier

# 构建模型
def create_model():
    # 构建模型
    model = Sequential()
    model.add(Dense(units=12, input_dim=8, activation='relu'))
    model.add(Dense(units=8, activation='relu'))
    model.add(Dense(units=1, activation='sigmoid'))

    # 编译模型
    model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

    return model

seed = 7
# 设定随机数种子
np.random.seed(seed)

# 导入数据
dataset = np.loadtxt('pima-indians-diabetes.csv', delimiter=',')
# 分割输入x和输出Y
x = dataset[:, 0 : 8]
Y = dataset[:, 8]

#创建模型 for scikit-learn
model = KerasClassifier(build_fn=create_model, epochs=150, batch_size=10, verbose=0)

# 10折交叉验证
kfold = StratifiedKFold(n_splits=10, shuffle=True, random_state=seed)
results = cross_val_score(model, x, Y, cv=kfold)
print(results.mean())


这个例子运行了三分钟!!!(可能我电脑真的太差了)

猜你喜欢

转载自blog.csdn.net/weixin_44474718/article/details/86249827