在《python深度学习》一书中,讲了通过Keras来实现IMDB电影二分类问题。
书中的代码
from keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(
num_words=10000)
load_data()并不能加载数据集,(可能是因为亚马逊服务器被墙)
在参考了网上一些解决方案,最终得到比较有效的解决。
1.数据集我们事先从其他地方进行下载,在这里我为大家提供已经下载好的数据集,大家自行下载
链接:https://pan.baidu.com/s/1R9whCGXiFb_tGxOWvFvoSA
提取码:hqkk
2.在数据集加载方面采用以下代码:
import numpy as np
# Load test data
imdb_data = np.load('imdb.npz')
imdb_data_dict = dict(zip(('train_data', 'train_label', 'test_data', 'test_label'), (imdb_data[k] for k in imdb_data)))
train_data, train_label, test_data, test_label = imdb_data_dict['train_data'], imdb_data_dict['train_label'], imdb_data_dict['test_data'], imdb_data_dict['test_label']
就可以成功进行加载数据集。