数据分析--pandas DataFrame

pandas DataFrame是一个表格类型的数据,含有一组有序的列,每列可以是不同的值类型(数值,字符串,布尔值)。DataFrame即有行索引,也有列索引,可以看作由Series组成的字典(公用同一个索引)。

DataFrame是以一个或者多个二维块存放的(而不是列表,字典或别的一维数据结构)

构建DataFrame

传入一个等长列表或Numpy数组组成的字典

 DataFrame会自动加上索引,且全部列会被有序排列

可以指定序列的排序

传入的列在数据中找不到,会产生Na值

从DataFrame中获取Series---类似字典的方式,返回与DataFrame一样的索引

给列赋值---注意长度必须跟DataFrame的长度相匹配

若赋值的是一个Series,会精确匹配DataFrame的索引,所有的空为会填上缺失值

注意:

  通过索引返回的数据只是相应数据的视图而已,并不是副本。因此,对返回的Series做的任何修改会反应到源DataFrame上

嵌套指点---字典的字典

  外层字典的键作为列,内层键作为行索引

 也可以对结果进行转置

猜你喜欢

转载自www.cnblogs.com/taoHongFei/p/9251470.html