[Pandas] [3] DataFrame selecciona el marco de datos secundarios por tipo de datos

DataFrame.select_dtypes( incluir = Ningunoexcluir = Ninguno )

Devuelve un subconjunto de las columnas del DataFrame según los tipos de columna.

Parámetros:

incluir, excluir  : escalar o similar a una lista

Una selección de tipos o cadenas que se incluirán / excluirán. Se debe proporcionar al menos uno de estos parámetros.

Devoluciones:

subconjunto  : DataFrame

El subconjunto del marco que incluye los dtypes  include y excluye los dtypes de  exclude.

Aumenta:

ValueError

  • Si ambos de  include y  exclude están vacíos
  • Si  include y  exclude tienen elementos superpuestos
  • Si se pasa algún tipo de cadena dtype.

Notas

  • Para seleccionar todos  los  tipos numéricos , utilice  np.number o 'number'
  • Para seleccionar cadenas, debe usar  object dtype, pero tenga en cuenta que esto devolverá  todas las  columnas de dtype de objeto
  • Ver la  jerarquía numpy dtype
  • Para seleccionar datetimes, uso  np.datetime64'datetime' o 'datetime64'
  • Para seleccionar timedeltas, uso  np.timedelta64'timedelta' o 'timedelta64'
  • Para seleccionar tipos categóricos de Pandas, use 'category'
  • Para seleccionar los tipos de fecha y hora de Pandas, use  'datetimetz' (nuevo en 0.20.0) o 'datetime64[ns, tz]'

Ejemplos

>>> df = pd.DataFrame ({'a': [1, 2] * 3, 
... 'b': [Verdadero, Falso] * 3, 
... 'c': [1.0, 2.0] * 3}) 
>>> df 
        abc 
0 1 Verdadero 1.0 
1 2 Falso 2.0 
2 1 Verdadero 1.0 
3 2 Falso 2.0 
4 1 Verdadero 1.0 
5 2 Falso 2.0
>>> df.select_dtypes (include = 'bool') 
   b 
0 Verdadero 
1 Falso 
2 Verdadero 
3 Falso 
4 Verdadero 
5 Falso
>>> df.select_dtypes (include = ['float64']) 
   c 
0 1.0 
1 2.0 
2 1.0 
3 2.0 
4 1.0 
5 2.0
>>> df.select_dtypes (exclude = ['int']) 
       bc 
0 Verdadero 1.0 
1 Falso 2.0 
2 Verdadero 1.0 
3 Falso 2.0 
4 Verdadero 1.0 
5 Falso 2.0

Supongo que te gusta

Origin blog.csdn.net/xiezhen_zheng/article/details/83716267
Recomendado
Clasificación