Harvey:
Busco a un modelo, una especie de onehotencoding , que podría mezclar columnas de la misma categoría en un único vector.
- Tener los Datos
[5,8,1,3]
- que se me da:
[0,1,0,1,0,1,0,0,1,0,0,0]
con un conjunto de tamaño arbitrario en 12.
Miré a bagofword pero no he encontrado cómo configurar el tamaño del vector de forma independiente de los datos de entrada.
Si alguien puede me da algunas pistas, que se encuentra.
kederrac:
puede utilizar np.zeros
y que el valor conjunto 1
de los índices de su data
lista:
z = np.zeros(12)
data = [5,8,1,3]
z[data] = 1
print(z)
salida:
[0. 1. 0. 1. 0. 1. 0. 0. 1. 0. 0. 0.]