[Reconocimiento de emociones] Reconocimiento de emociones por voz basado en una red neuronal [Con código fuente 544 de Matlab]

1. Introducción

La red BP (Back Propagation), propuesta por un equipo de científicos liderados por Rumelhart y McCelland en 1986, es una red de retroalimentación multicapa entrenada por un algoritmo de retropropagación de error, y actualmente es uno de los modelos de redes neuronales más utilizados. La red BP puede aprender y almacenar una gran cantidad de relaciones de mapeo de patrones de entrada-salida sin revelar las ecuaciones matemáticas que describen esta relación de mapeo por adelantado.
En la historia del desarrollo de redes neuronales artificiales, hace mucho tiempo que no se ha encontrado un algoritmo eficaz para ajustar el peso de la conexión de la capa oculta. Hasta que se propuso el algoritmo de retropropagación de errores (algoritmo BP), se resolvió con éxito el problema del ajuste de peso de las redes neuronales de alimentación directa multicapa para resolver funciones continuas no lineales.

La red neuronal BP (Back Propagation), el proceso de aprendizaje del algoritmo de retropropagación de error, consta de dos procesos: propagación hacia adelante de información y propagación hacia atrás del error. Cada neurona en la capa de entrada es responsable de recibir información de entrada desde el exterior y transmitirla a cada neurona en la capa intermedia; la capa intermedia es la capa interna de procesamiento de información y es responsable de la transformación de la información. Según la demanda de capacidad de cambio de información , la capa intermedia se puede diseñar como una sola capa oculta o una estructura de capa múltiple oculta; la última capa oculta transmite la información de cada neurona en la capa de salida, después de un procesamiento adicional, completa un proceso de propagación hacia adelante de aprendizaje y la capa de salida envía el resultado del procesamiento de la información al mundo exterior. Cuando la salida real no coincide con la salida esperada, se ingresa a la fase de retropropagación del error. El error pasa a través de la capa de salida, corrige los pesos de cada capa en el camino del descenso del gradiente de error y lo transmite de vuelta a la capa oculta y a la capa de entrada capa por capa. El proceso repetido de propagación hacia adelante de información y propagación hacia atrás de errores es un proceso de ajuste constante de los pesos de cada capa, así como un proceso de aprendizaje y entrenamiento de redes neuronales. Este proceso continúa hasta que se reduce el error de salida de la red. a un nivel aceptable, o preestablecido hasta el número establecido de estudios.

Modelo de red neuronal de BP El modelo de red de BP incluye su modelo de entrada y salida, modelo de función de acción, modelo de cálculo de errores y modelo de autoaprendizaje.
Inserte la descripción de la imagen aquí

2 Modelo de red neuronal de BP y sus principios básicos

3 Flujo del algoritmo BP_PID

En segundo lugar, el código fuente

lc 
close all
clear all
load A_fear fearVec;
load F_happiness hapVec;
load N_neutral neutralVec;
load T_sadness sadnessVec;
load W_anger angerVec;
 trainsample(1:30,1:140)=angerVec(:,1:30)';
 trainsample(31:60,1:140)=hapVec(:,1:30)';
 trainsample(61:90,1:140)=neutralVec(:,1:30)';
 trainsample(91:120,1:140)=sadnessVec(:,1:30)';
 trainsample(121:150,1:140)=fearVec(:,1:30)';
  trainsample(1:30,141)=1;
   trainsample(31:60,141)=2;
   trainsample(61:90,141)=3;
   trainsample(91:120,141)=4; 
   trainsample(121:150,141)=5;
   testsample(1:20,1:140)=angerVec(:,31:50)';
  testsample(21:40,1:140)=hapVec(:,31:50)';
 testsample(41:60,1:140)=neutralVec(:,31:50)';
  testsample(61:80,1:140)=sadnessVec(:,31:50)';
  testsample(81:100,1:140)=fearVec(:,31:50)';
  testsample(1:20,141)=1;
   testsample(21:40,141)=2;
    testsample(41:60,141)=3;
    testsample(61:80,141)=4; 
    testsample(81:100,141)=5;
  class=trainsample(:,141);
sum=bpnn(trainsample,testsample,class);
figure(1)
bar(sum,0.5);
set(gca,'XTickLabel',{
    
    '生气','高兴','中性','悲伤','害怕'});
ylabel('识别率');
xlabel('五种基本情感');

p_train=trainsample(:,1:140)';
t_train=trainsample(:,141)';
p_test=testsample(:,1:140)';
t_test=testsample(:,141)';
sumpnn=pnn(p_train,t_train,p_test,t_test);
figure(2)
bar(sumpnn,0.5);
set(gca,'XTickLabel',{
    
    '生气','高兴','中性','悲伤','害怕'});
ylabel('识别率');
xlabel('五种基本情感');
sumlvq=lvq(trainsample,testsample,class);
function sum=bpnn(trainsample,testsample,class)
%输入参数：trainsample是训练样本,testsample是测试样本,class表示训练样本的类别，与trainsample中数据对应
%sum：五种基本情感的识别率
for i=1:140
    feature(:,i)= trainsample(:,i);
end
%特征值归一化
[input,minI,maxI] = premnmx( feature')  ;

%构造输出矩阵
s = length( class ) ;
output = zeros( s , 5  ) ;
for i = 1 : s 
   output( i , class( i )  ) = 1 ;
end

%创建神经网络
net = newff( minmax(input) , [10 5] , {
    
     'logsig' 'purelin' } , 'traingdx' ) ;   %创建前馈神经网络

%设置训练参数
net.trainparam.show = 50 ;
net.trainparam.epochs = 150 ;
net.trainparam.goal = 0.1 ;
net.trainParam.lr = 0.05 ;

%开始训练
net = train( net, input , output' ) ;

%读取测试数据
for i=1:140
    featuretest(:,i)= testsample(:,i);
end
 c=testsample(:,141);
%测试数据归一化
testInput = tramnmx(featuretest' , minI, maxI ) ;

%仿真
Y = sim( net , testInput ) 
sum=[0 0 0 0 0]; %每类情感正确识别个数
%统计识别正确样本数 
for i=1:20
    if Y(1,i)>Y(2,i)&&Y(1,i)>Y(3,i)&&Y(1,i)>Y(4,i)&&Y(1,i)>Y(5,i)
        sum(1)=sum(1)+1;
    end
    function sumlvq=lvq(trainsample,testsample,class)
P=trainsample(:,1:140)';
C=class';
T=ind2vec(C);
net=newlvq(minmax(P),20,[0.2 0.2 0.2 0.2 0.2],0.1); %创建lvq网络
w1=net.IW{
    
    1};
net.trainParam.epochs=100;
net=train(net,P,T);
y=sim(net,testsample(:,1:140)');
y3c=vec2ind(y);
sumlvq=[0 0 0 0 0]; %每类情感正确识别个数
%统计识别正确样本数 
for i=1:20
    if y3c(i)==1
        sumlvq(1)=sumlvq(1)+1;
    end
end
for i=21:40
    if y3c(i)==2
        sumlvq(2)=sumlvq(2)+1;
    end
end
for i=41:60
    if y3c(i)==3
        sumlvq(3)=sumlvq(3)+1;
    end
end
for i=61:80
    if y3c(i)==4
        sumlvq(4)=sumlvq(4)+1;
    end
end
for i=81:100
end

Tres, resultados en ejecución

Inserte la descripción de la imagen aquí

Cuatro, comentarios