Tengo las siguientes series:
myseries = pd.Series([' Period : From 1 February 2020 to 31 January 2021',
' Period : 1 January 2020 to 31 December 2020',
' Period 67 months',
' Period: 8 Months'])
Quiero convertir los objetos de fecha y hora en las que hay dos fechas (sólo el primer 2) en formato de fecha y hora, mientras que los demás se mantienen en su formato original.
es decir, - [('02-01-2020', '01-31-2021'), ('01-01-2020', '12-31-2020'), 'Period: 67 Months', 'Period: 8 Months']
He intentado lo siguiente, pero me estoy poniendo un objeto de fecha y hora para los que no tienen una fecha adecuada.
for i,v in myseries.iteritems():
matches = list(datefinder.find_dates(v))
if len(matches) > 0:
print(matches)
He intentado usar el staticmethod
argumento de datefinder find_dates()
, lo que me da la siguiente. Puedo trabajar con esto, sin embargo, no soy capaz de extraer los objetos que requiero.
[(datetime.datetime(2020, 2, 1, 0, 0), '1 February 2020'), (datetime.datetime(2021, 1, 31, 0, 0), '31 January 2021')]
[(datetime.datetime(2020, 1, 1, 0, 0), '1 January 2020'), (datetime.datetime(2020, 12, 31, 0, 0), '31 December 2020')]
[(datetime.datetime(2067, 4, 4, 0, 0), '67 mon')]
[(datetime.datetime(2020, 4, 8, 0, 0), '8 Mon')]
Mi salida deseada es de 2 listas:
date_1 = ['1 February 2020', '1 January 2020', '67 mon', '8 Mon']
date_2 = ['31 January 2021', '31 December 2020', '67 mon', '8 Mon']
Damon:
myseries.apply(lambda x: [x[1] for x in datefinder.find_dates(x, source=True)][:2] if not pd.isna(x) else [])
Básicamente, utilice el parámetro de origen para obtener la fecha original, entonces, si la lista de fechas es mayor que 2, 2 conseguir la primera.
Si quieres DATE_1 y fecha_2:
date_1 = []
date_2 = []
dates = myseries.apply(lambda x: [x[1] for x in datefinder.find_dates(x, source=True)][:2])
for date in dates:
if len(date)==0:
date_1.append(np.nan)
date_2.append(np.nan)
if len(date)>0:
date_1.append(date[0])
if len(date)>1:
date_2.append(date[1])
elif len(date)>0:
date_2.append(date[0])