Pandas elimina los drop_duplicates anteriores o siguientes
Referencia: https://blog.csdn.net/weixin_42690752/article/details/103464588
pandas库中的drop_duplicates()函数简直就是去重的神器,该函数还可以在去重中人为设置保留靠前的记录还是靠后的记录。
DataFrame.drop_duplicates(self, subset=None, keep='first', inplace=False)[source]
一共有三个参数,subset、keep和inplace
subset参数
subset : column label or sequence of labels, optional
Only consider certain columns for identifying duplicates, by default use all of the columns
subset参数用来设置以哪些列的重复作为重复的标准,参数为列标签,如果不设置该值,则默认为以所有列作为重复的判断条件。
keep参数
keep : {
‘first’, ‘last’, False}, default ‘first’
first : Drop duplicates except for the first occurrence.
last : Drop duplicates except for the last occurrence.
False : Drop all duplicates.
keep可以设置为三个参数,默认为first
first表示保留第一次出现的记录
last表示保留最后一次出现的记录
False表示把所有重复的删除
inplace参数
inplace : boolean, default False
Whether to drop duplicates in place or to return a copy
inplace可以设置为True或False,默认为False
True表示原地去重,会改变dataframe
False表示会返回一个新的dataframe,不会改变原来的变量
pandas atraviesan Dataframe fila por fila
Referencia: https://blog.csdn.net/d1240673769/article/details/112407978
for index,row in df.iterrows():
print(index,type(row),row['code'],row['name'])
#对于每一行,通过列名访问对应的元素
print("-----")
Cómo usar random.shuffle() para mezclar el orden de la lista
# shuffle()使用样例
import random
x = [i for i in range(10)]
print(x)
random.shuffle(x)
print(x)