数据分析与处理笔记一

前面因为考试等不可抗力将近两个月没有玩python,现在重新拾起。这两个月间匆匆完成了百步梯攀登计划的中期汇报表,还拿到了华为的免面试通知,放假和高中同学出去浪时甚至还笑谈着说要考浙大(笑)

《数据分析与处理》是中国大学mooc上的一门经典课程,我之前刷了一遍没有通关,而这次是重头再来,很多函数与使用方法不好记,因此有了这篇笔记。

1.pandas 包的DataFrame

(之前做ricequant网站上量化投资时用过的)

import numpy as np
import pandas as pd
s = pd.Series([1,3,5,np.nan,6,8]);
a = pd.DataFrame({"A":['abc138','abc306','sss400'],
                  "B":['mid444','red406','siri460']});

df.dtype,df.columns,df.index等一系列使用方法;

2.数组矩阵的生成等(np库为主)

import tushare as ts
import numpy as np
v=np.arange(15);生成1到15
x = np.ones((4,3,4));(全1矩阵,可以用x.shape输出的维度)
a= np.linspace(1,10,5);

3.np数组的重构

a = np.ones((2,3,4),dtype=np.int32);
a.reshape((3,8))改变形状
print(a.tolist());变成列表输出

4.文件读取

import numpy as np

a = np.arange(100).reshape(5,20);
np.savetxt('a.txt',a,fmt="%d");

c = np.loadtxt('a.csv');
print(c);

d = np.arange(100).reshape(5,10,2);
print(d);

d.tofile("b.dat",format="%d");

e = np.fromfile("b.dat",dtype=np.int).reshape(5,10,2);
print(e);


np.save("a.npy",a);

5.random 包括np.random.randint

6.图像

from PIL import Image
import numpy as np
im = np.array(Image.open("D:/ssni/1.jpg"));
print(im.shape,im.dtype);

猜你喜欢

转载自blog.csdn.net/leitingjiang/article/details/81125590