CHRD:
私がしているdf
その下に私はに従ってソートしているID
変数と時間変数T
の二次ソートなど。
df = pd.DataFrame({
'ID': ['a', 'b', 'c', 'b', 'b'],
'T': [
datetime.datetime(2019, 1, 1),
datetime.datetime(2017, 1, 1),
datetime.datetime(2018, 1, 1),
datetime.datetime(2020, 1, 1),
datetime.datetime(2021, 1, 1)],
'V': [3, 5, 8, 6, 1]
}).sort_values(['ID', 'T'], ascending=False)
df
ID T V
2 c 2018-01-01 8
4 b 2021-01-01 1
3 b 2020-01-01 6
1 b 2017-01-01 5
0 a 2019-01-01 3
私は、新しい列を追加したいV_L
各、ID
、(時間列に基づいて、最後の値がT
)示されているが。何の最後の値が存在しない場合、これはで表示されなければならないnull
の値V_L
。出力例は次のようになります。
df
ID T V V_L
0 a 2018-01-01 8 NaN
1 b 2021-01-01 1 6.0
2 b 2020-01-01 6 5.0
3 b 2017-01-01 5 NaN
4 c 2019-01-01 3 NaN
YOBEN_S:
デイモン
df['V_L'] = df.groupby('ID').V.shift(-1)
df
Out[350]:
ID T V V_L
2 c 2018-01-01 8 NaN
4 b 2021-01-01 1 6.0
3 b 2020-01-01 6 5.0
1 b 2017-01-01 5 NaN
0 a 2019-01-01 3 NaN