[Pandas] [3] DataFrame selecciona el marco de datos secundarios por tipo de datos

DataFrame.select_dtypes( incluir = Ninguno , excluir = Ninguno )

Devuelve un subconjunto de las columnas del DataFrame según los tipos de columna.

Parámetros:	incluir, excluir : escalar o similar a una lista Una selección de tipos o cadenas que se incluirán / excluirán. Se debe proporcionar al menos uno de estos parámetros.
Devoluciones:	subconjunto : DataFrame El subconjunto del marco que incluye los dtypes `include` y excluye los dtypes de `exclude`.
Aumenta:	ValueError Si ambos de `include` y `exclude` están vacíos Si `include` y `exclude` tienen elementos superpuestos Si se pasa algún tipo de cadena dtype.

Parámetros:

incluir, excluir : escalar o similar a una lista

Una selección de tipos o cadenas que se incluirán / excluirán. Se debe proporcionar al menos uno de estos parámetros.

Devoluciones:

subconjunto : DataFrame

El subconjunto del marco que incluye los dtypes include y excluye los dtypes de exclude.

Aumenta:

ValueError

Si ambos de include y exclude están vacíos

Si include y exclude tienen elementos superpuestos

Si se pasa algún tipo de cadena dtype.

Notas

Para seleccionar todos los tipos numéricos , utilice np.number o 'number'
Para seleccionar cadenas, debe usar object dtype, pero tenga en cuenta que esto devolverá todas las columnas de dtype de objeto
Ver la jerarquía numpy dtype
Para seleccionar datetimes, uso np.datetime64, 'datetime' o 'datetime64'
Para seleccionar timedeltas, uso np.timedelta64, 'timedelta' o 'timedelta64'
Para seleccionar tipos categóricos de Pandas, use 'category'
Para seleccionar los tipos de fecha y hora de Pandas, use 'datetimetz' (nuevo en 0.20.0) o 'datetime64[ns, tz]'

Ejemplos

>>> df = pd.DataFrame ({'a': [1, 2] * 3, 
... 'b': [Verdadero, Falso] * 3, 
... 'c': [1.0, 2.0] * 3}) 
>>> df 
        abc 
0 1 Verdadero 1.0 
1 2 Falso 2.0 
2 1 Verdadero 1.0 
3 2 Falso 2.0 
4 1 Verdadero 1.0 
5 2 Falso 2.0

>>> df.select_dtypes (include = 'bool') 
   b 
0 Verdadero 
1 Falso 
2 Verdadero 
3 Falso 
4 Verdadero 
5 Falso

>>> df.select_dtypes (include = ['float64']) 
   c 
0 1.0 
1 2.0 
2 1.0 
3 2.0 
4 1.0 
5 2.0

>>> df.select_dtypes (exclude = ['int']) 
       bc 
0 Verdadero 1.0 
1 Falso 2.0 
2 Verdadero 1.0 
3 Falso 2.0 
4 Verdadero 1.0 
5 Falso 2.0

[Pandas] [3] DataFrame selecciona el marco de datos secundarios por tipo de datos

Supongo que te gusta