Cómo mezclar onehotencoding y bagofword

Harvey:

Busco a un modelo, una especie de onehotencoding , que podría mezclar columnas de la misma categoría en un único vector.

  • Tener los Datos [5,8,1,3]
  • que se me da: [0,1,0,1,0,1,0,0,1,0,0,0]

con un conjunto de tamaño arbitrario en 12.

Miré a bagofword pero no he encontrado cómo configurar el tamaño del vector de forma independiente de los datos de entrada.

Si alguien puede me da algunas pistas, que se encuentra.

kederrac:

puede utilizar np.zerosy que el valor conjunto 1de los índices de su datalista:

z = np.zeros(12)
data = [5,8,1,3]
z[data] = 1
print(z)

salida:

[0. 1. 0. 1. 0. 1. 0. 0. 1. 0. 0. 0.]

Supongo que te gusta

Origin http://10.200.1.11:23101/article/api/json?id=402327&siteId=1
Recomendado
Clasificación