pandas中有关机器学习的一些知识点笔记4

一、这次主要是pandas中的Series部分的一些小知识点。
Series:就是DateFrame中的一行或者一列
DateFrame:通过read.CSV读入形成的数据矩阵,由一系列的series结构组成
1.通过Series结构对文件进行读取
2.读取文件进行索引
3.用Series进行排序

#1.通过Series结构对文件进行读取
fandango=pd.read_csv(r"D:\Python.code(4)\2-pandas\fandango_score_comparison.csv")
series_film=fandango['FILM']
print(type(series_film))
print(series_film[0:5])#film列中,0到5行
series_rt=fandango["RottenTomatoes"]
print(series_rt[0:5])# RottenTomatoes列中,0到5行

#2.读取文件进行索引
from pandas import Series
film_names=series_film .values
print(type(film_names))
print(film_names)
rt_scores=series_rt.values
print(rt_scores)
series_custom=Series(rt_scores,index=film_names)#Series将电影名(string)作为索引值
series_custom[['Cinderella (2015)','Top Five (2014)']]
fiveten=series_custom[5:10]
print(fiveten)

#3.用Series进行排序
original_index=series_custom.index.tolist()#索引转化成列表
print(original_index)
sorted_index=sorted(original_index)#进行排序
sorted_by_index=series_custom.reindex(sorted_index)
print(sorted_by_index)

二、对于lambad 的讲解:
lambad 表达式就是一个函数,可以赋值给一个变量,既然是表达式,可以参与运算。
lambda x: x * 2 这个匿名函数的形参是x,表达式x * 2的值就是这个函数的返回值。

>>> lambda x: x ** 2
<function <lambda> at 0x1007f7668>
>>> (lambda x: x ** 2)(2)
4
>>> f = lambda x: x ** 2
>>> f(2)
4
>>>

map(lambda x: x ** 2, range(1, 11))
结果是。
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]。
也可以这样 f = lambda x: x ** 2
map(f, range(1, 11))

参考:https://zhuanlan.zhihu.com/p/21325182
本文以唐宇迪老师机器学习讲解为基础进行编写,仅供学习和参考。

猜你喜欢

转载自blog.csdn.net/weixin_42836427/article/details/81390831