¿Cómo consigo la suma de las columnas de un archivo CSV en filas especificadas mediante la introducción de fechas como variables en Python?

Utkarsh:
Fecha, horas, Conde, Estado 
2018-01-02,4,15, SFZ 
2018-01-03,5,16, ACZ 
2018-01-04,3,14, SFZ 
2018-01-05,5,15, SFZ 
2018-01-06,5,18, ACZ

Esta es la fracción de los datos a lo que he estado trabajando. Los datos reales se encuentra en el mismo formato con alrededor de 1.000 entradas de cada día en ella. Estoy tomando el fecha_inicial y fecha_final como entradas de usuario:

start_date=dt.date(2018, 1, 2)
end_date=dt.date(2018, 1, 23)

Ahora, tengo que mostrar un total de horas y el recuento dentro del intervalo de fechas seleccionado, en la salida. Soy capaz de hacerlo introduciendo las fechas entre directamente en la cláusula, el uso de este fragmento:

df = df.loc[df['Date'].between('2018-01-02','2018-01-06'), ['hrs','Count']].sum()
print (df)

Salida:

hrs 22 
Contador 78 
dtype: Int64

Estoy usando pandas y de fecha y hora de la biblioteca. Pero, quiero pasarlos utilizando las variables Fecha_inicial y fecha_final ya que podrían cambiar cada vez. He intentado que lo sustituya, dosis no me da un error, pero el total de 0 espectáculos.

df = df.loc[df['Date'].between('start_date','end_date'), ['hrs','Count']].sum()
print (df)

Salida:

Duration_hrs 0 
REJECT_COUNT 0 
dtype: Int64
Serge Ballesta :

Sólo es necesario convertir todos los valores de un tipo compatible, pd.Timestamp:

df = df.loc[pd.to_datetime(df['Date']).between(pd.Timestamp(start_date),
                                               pd.Timestamp(end_date)),
            ['hrs','Count']].sum()

Supongo que te gusta

Origin http://10.200.1.11:23101/article/api/json?id=399819&siteId=1
Recomendado
Clasificación