Fecha, horas, Conde, Estado 2018-01-02,4,15, SFZ 2018-01-03,5,16, ACZ 2018-01-04,3,14, SFZ 2018-01-05,5,15, SFZ 2018-01-06,5,18, ACZ
Esta es la fracción de los datos a lo que he estado trabajando. Los datos reales se encuentra en el mismo formato con alrededor de 1.000 entradas de cada día en ella. Estoy tomando el fecha_inicial y fecha_final como entradas de usuario:
start_date=dt.date(2018, 1, 2)
end_date=dt.date(2018, 1, 23)
Ahora, tengo que mostrar un total de horas y el recuento dentro del intervalo de fechas seleccionado, en la salida. Soy capaz de hacerlo introduciendo las fechas entre directamente en la cláusula, el uso de este fragmento:
df = df.loc[df['Date'].between('2018-01-02','2018-01-06'), ['hrs','Count']].sum()
print (df)
Salida:
hrs 22 Contador 78 dtype: Int64
Estoy usando pandas y de fecha y hora de la biblioteca. Pero, quiero pasarlos utilizando las variables Fecha_inicial y fecha_final ya que podrían cambiar cada vez. He intentado que lo sustituya, dosis no me da un error, pero el total de 0 espectáculos.
df = df.loc[df['Date'].between('start_date','end_date'), ['hrs','Count']].sum()
print (df)
Salida:
Duration_hrs 0 REJECT_COUNT 0 dtype: Int64
Sólo es necesario convertir todos los valores de un tipo compatible, pd.Timestamp
:
df = df.loc[pd.to_datetime(df['Date']).between(pd.Timestamp(start_date),
pd.Timestamp(end_date)),
['hrs','Count']].sum()