numpyのパンダ学習

A. 多くのリストより高効率の配列
データのnumpyの効率的な処理、アレイをサポートする、Pythonのデフォルトは、配列ではありません。パンダは、scipyのダウンロード、matplotlibのはnumpyのを頼っています。
主にデータマイニングのためのパンダは、分析探検
maiplotlibは、マッピング、可視化のために使用され
、積分、フーリエ変換結石:などscipyのダウンロード数値計算、
統計解析のために使用さstatsmodels
テキストマイニングのためのGensim
sklearnの機械学習、kerasの深さの調査
II。
ダウンロードしてnumpyのMKLインストール
パンダのネットワークインストールをしてmaiplotlib
scipyのダウンロードダウンロードしてインストール
statsmodelsにGensimネットワークインストールおよび
3つのnumpyの操作を。
numpyのインポート
#は、一次元アレイのセット番号を作成
([要素...... N-、素子1、素子2])#1 numpy.arrayを
X = numpy.array([ 'A'、 '9' 、' 8' 、 '1'])
は、二次元アレイフォーマットの作成
#1 numpy.array([素子1、素子2、素子...... n]は、[要素1、要素2、要素...... n]を[素子1、素子2、素子...... N-])
Y = numpy.array([3,5,7]、[9,2,6]、[5,3,0] )
#ソート
x.sort()
y.sort()
#最大値
Y1 = y.max()
最小値
Y2 = y.main()
スライス
4匹のパンダの動作を制御します。
インポートAS PDAパンダ
データを生成するために使用#パンダ
デフォルトの行インデックス名、シリーズゼロベースのインデックス指定されたデータの一連の#シリーズインデックス代表
#データフレームは代表的なデータフレームを統合するランクは、列は、列名の指定
(A = pda.Seriesを[8 、9,2 ,.] 1、インデックス= [ 'つ'、 'TWO'、 '三'、 'フォー'])
リスト形式のデータブロックを作成
B = pda.DataFrame([5,6,2を、 3]、[3,5,1,4]、[ 7,9,3,5]、列は= [ '1'、 '2'、 '3'、 '4']、インデックス= [ '1' 、 '2'、 '三'])
辞書データフレームフォーマットを作成する
C = pda.DataFrame({
'一' :. 4、#意志オートコンプリート
'2'を[6,2,3]、
「スリー「:リスト(STR(982))
})
#1 b.head(行数)デフォルトのラインヘッド取る前に#5
#bを。

b.head = E()
F = b.describe()
の転置#データ、行、列と列が行になるとなっ
G = BT
5つのPythonのデータインポート
パッドとしてインポートパンダ
F =オープン(「D:/大型の.csv '' RB ')
インポートCSV
A = pad.read_csv(F、エンコーディング=' Pythonの「)
多くの列は行数を示し
a.shape()
a.values [0] [2]第一回線# 3列目の
#説明CSVデータ
B = a.describe()
ソート
C = a.sort_values()
インポートエクセル
D = pad.read_excel( 'D:/大* .XLS')
プリント(D)
プリント(d.describe ())
インポートMySQLの
pymysqlインポート
コネティカット= pymysql.connect(ホスト=、=ユーザー'ルート'は、passwd = 'ルート' 'localhost'の、DB = '')
SQLは= '' mydbというSELECT * FROM
E = pad.read_sql (SQL、CONN)
#インポートhtmlフォームデータはhtml5libとBS4をインストールする必要があります
pad.read_html = G( 'https://book.douban.com/subject/30258976/?icn=index-editionrecommend')
インポートテキストデータ
H = pad.read_table( 'D:/lianjie.txt '、「RB '=エンジン' Pythonの)
プリント(h.describe())
6つのmatplotlibの使用
#折れ線グラフ/散布プロット
HISTのと#ヒストグラムを
PYL ASインポートmatplotlib.pylab
インポートnumpyのAS NPY
X = [1,2 、4,6,8,9]
Y = [5,6,7,8,9,0]
pyl.plot(X、Y)#plot(X軸、Y軸データ、プレゼンテーションの形式のデータ)
#散乱O図、デフォルトは、直線cシアンR赤、シアン、マゼンタ、赤色Mのmagente gのグリーンB、青、緑、黄色、青Y黄W白白
細線破線:ストレート- - -点線-フォーム#
#1 S *星六角正方形H XX +プラス菱形形D p個の五角形の
pyl.plot(X、Y、 'D')
pyl.title( '名前')#名
pyl.xlabel( 'のXName')は軸名#X
pyl.ylabel(「ynameの名前を")#Y軸名
pyl.xlim(0,20)#は、x軸の範囲セット
(2,22)pyl.ylimを#は、y軸の範囲セット
pyl.show()
は、乱数生成
データ=のnpy.random.random_integers(1,20,100)を#(最小、最大、数)
#正常乱数生成
DATA2を= npy.random.normal(10.0、1.0、 10000)#( 平均、シグマ、数)
HISTの位ヒストグラム
pyl.hist (データ)
pyl.hist(DATA2)
設定上下ヒストグラム
のSTY = npy.arange(2,20,2)#ステップ幅ヒストグラム前記
pyl.histは(データ、STY、histt​​ype = 'はstepfilled' )を除去#輪郭
描画とサブピクチャ#1の使用
pyl.subplot(2、2、2)、 #(行、列、この領域)
X1 = [2,3,5,8,6,7]
Y1 = [2、 3,5,9,6,7]
pyl.plot(X1、Y1)
pyl.subplot(2,2 ,. 1)#(行、列、この領域)
X1 = [2,3,5,9,6、 7〕
Y1 = [2,3,5,9,6,7]
pyl.plot(X1、Y1)
pyl.subplot(2、1、2)、 #(行、列、この領域)
X1 = [2,3,5,9,6,7]
Y1 = [2,3,9,5,6,7]
PYL .PLOT(X1、Y1)
pyl.show()

おすすめ

転載: www.cnblogs.com/liu-xiaoyi/p/11106737.html