pandas.Series.rank()用法的理解

今天看了《基于python的大数据分析基础及实战》看到了pandas.Series.rank()默认情况下的结果
注:pandas.Series.rank()把对象的value替换为数值等级(相应的名次)。

import pandas as pd
from pandas import Series
ser = Series([4,2,0,3],index=list('abcd'))
ser.rank()

结果是
a 4.0
b 2.0
c 1.0
d 3.0
dtype: float64

import pandas as pd
from pandas import Series
ser = Series([3,2,0,3],index=list('abcd'))
ser.rank()

结果是
a 3.5
b 2.0
c 1.0
d 3.5
dtype: float64

我的理解就是如果是平级,那么其默认的情况等级就是(3+4)/2 = 3.5

import pandas as pd
from pandas import Series
ser = Series([3,2,0,3,3],index=list('abcde'))
ser.rank()

结果是
a 4.0
b 2.0
c 1.0
d 4.0
e 4.0
dtype: float64
(3+4+5)/3 = 4

Series.rank(axis=0, method=‘average’, numeric_only=None, na_option=‘keep’, ascending=True, pct=False)具体用法不介绍。

发布了3 篇原创文章 · 获赞 0 · 访问量 49

猜你喜欢

转载自blog.csdn.net/weixin_44356655/article/details/104499008