matlab nprtool多分类（模式识别神经网络)

一、模式识别神经网络

在matlab命令窗口输入：nnstart 或 nprtool 就可以进入matlab神经网络GUI

二、鸢尾花数据集iris示例

1.输入数据集，划分训练集、测试集

load fisheriris;
[m,n]=size(meas);
data=zeros(m,n+1);
data(:,1:n)=meas;
for i=1:m                   　　　　　　　　　 %将字符串类别标签用数值形式表示
    if strcmp(species{i},'setosa')　　　　　　%strcmp（'A','B'）用于比较字符串，找出特定的字符串；类比find（a==b）用来找出特定数值
        data(i,n+1)=1;
    elseif strcmp(species{i},'versicolor')
        data(i,n+1)=2;
    elseif strcmp(species{i},'virginica')
        data(i,n+1)=3;
    end
end

%选择训练样本个数
num_train = 60;　　　　　　　　　　　　　　　　　%共150个样本，60个训练集，90个测试集
%构造随机选择序列
choose = randperm(length(data));           %随机种子打乱数据样本的顺序
train_data = data(choose(1:num_train),:);  %随机选取60个样本
label_temp = train_data(:,end);            %提取训练数据的标签  train(:,end)提取最后一列；
label_train = zeros(length(train_data),3); %创建矩阵以储存向量形式的标签；
%把输出分类标签1，2，3 改为工具箱要求的格式 1=[1 0 0],2=[0 1 0],3=[0 0 1]
for i = 1:length(train_data)
    label_train(i,label_temp(i)) = 1; 
end
train_data = train_data(:,1:end-1)';       %提取数据集特征（剔除标签），并进行转置（转置也可以不必，后续GUI中转化为行形式即可）
label_train = label_train';                %将向量形式表示的标签进行转置（也而不必，理由同上）

test_data = data(choose(num_train+1:end),:);  %提取测试集数据
label_temp = test_data(:,end);                %提取测试集数据的标签
label_test = zeros(length(test_data),3);      %创建矩阵，准备存放向量形式的测试数据的标签
%把输出分类标签改为工具箱要求的格式
for i = 1:length(test_data)
    label_test(i,label_temp(i)) = 1; 
end
test_data = test_data(:,1:end-1)';            %提取测试数据的特征，并进行转置
label_test = label_test';                     %提取测试数据的标签，并进行转置

2. 三种方法进行模式识别神经网络搭建

2.1 手动编写m函数法

法1操作方法：手动编写m函数如下（借鉴参考资料）

%有三种方式
%法1.命令窗口输入nnstart,选择pattern recognition app，用matlab自带GUI进行网络设置（最简单）
%法2.完成法1后，自动生成代码，将创建网络的代码用m文件保存，下次要调用该网络可直接调用该m文件
%法3.编写如下代码
% Create a Pattern Recognition Network
hiddenLayerSize = 10;                         %隐藏层神经元个数设置为10
net = patternnet(hiddenLayerSize);            %创建模式识别神经网络patternnet
% 将训练集再按比例70:15:15分为训练集、验证集、测试集
net.divideParam.trainRatio = 70/100;
net.divideParam.valRatio = 15/100;
net.divideParam.testRatio = 15/100;
% Train the Network
[net,tr] = train(net,train_data,label_train); %tr为训练过程参数？
% Test the Network
predict = net(test_data);       %得到每个样本属于第一类、第二类、第三类的概率
[~,predict] = max(predict);     %选择概率最大的类别作为某一个测试样本的类别
%% show the result --testings
fig=figure;
gscatter(test_data(1,:),test_data(2,:),predict);
[~,label_test] = max(label_test);
accuracy = length(find(predict==label_test))/length(test_data);
title(['predict the testing data and the accuracy is :',num2str(accuracy)]);

法1结果：

准确率：93.3%，分类效果不错。

2.2 GUI法

法2操作方法：

输入nnstart：四种形式的神经网络：拟合/分类/聚类/时间序列。分类选择nprtool

输入nprtool:

注意这里的samples是按行还是按列，如果选择错误则无法点击next

法2结果：训练集的混淆矩阵

可以重点看训练集（分为0.7：0.15：0.15）中的测试集（是否有必要将训练集也这么分？）；

得到准确率为88.9%，较高，分类效果不错。

法2操作：加入测试集

法2结果：测试集的混淆矩阵

准确率为96.7%，分类效果很好。

2.3 自动生成代码法

法3操作方法：由法1GUI得到的网络自动生成m代码如下，之后可直接调用该m文件，不需要用GUI。

操作如下：

点击Simple Scrip即可自动生成代码

代码如下：

% Solve a Pattern Recognition Problem with a Neural Network
% Script generated by Neural Pattern Recognition app
% Created 21-May-2020 20:32:42
%
% This script assumes these variables are defined:
%
%   train_data - input data.
%   label_train - target data.

x = train_data;
t = label_train;

% Choose a Training Function
% For a list of all training functions type: help nntrain
% 'trainlm' is usually fastest.
% 'trainbr' takes longer but may be better for challenging problems.
% 'trainscg' uses less memory. Suitable in low memory situations.
trainFcn = 'trainscg';  % Scaled conjugate gradient backpropagation.

% Create a Pattern Recognition Network
hiddenLayerSize = 10;
net = patternnet(hiddenLayerSize);

% Setup Division of Data for Training, Validation, Testing
net.divideParam.trainRatio = 70/100;
net.divideParam.valRatio = 15/100;
net.divideParam.testRatio = 15/100;

% Train the Network
[net,tr] = train(net,x,t);

% Test the Network
y = net(x);
e = gsubtract(t,y);
performance = perform(net,t,y)
tind = vec2ind(t);
yind = vec2ind(y);
percentErrors = sum(tind ~= yind)/numel(tind);

% View the Network
view(net)

% Plots
% Uncomment these lines to enable various plots.
%figure, plotperform(tr)
%figure, plottrainstate(tr)
%figure, ploterrhist(e)
%figure, plotconfusion(t,y)
%figure, plotroc(t,y)

参考资料：

1.监督算法之BP，SVM,adaboost的非线性多分类实验，https://blog.csdn.net/on2way/article/details/48006539，作者：on2way

2.matlab神经网络工具箱：https://blog.csdn.net/on2way/article/details/47428201

3.adaboost分类：https://www.cnblogs.com/litthorse/p/9332370.html

matlab nprtool多分类（模式识别神经网络)

猜你喜欢