Numpy はオープン ソースの Python 科学計算ライブラリです. Python 科学計算ライブラリの基本ライブラリです. Pandas や Scikit-learn などの他の多くの有名な科学計算ライブラリは Numpy ライブラリのいくつかの関数を使用する必要があります.
1.Numpyの基本的な使い方
1. Numpy 配列オブジェクト
Numpy の多次元配列は ndarray と呼ばれ、Numpy で最も一般的な配列オブジェクトです。ndarray オブジェクトには通常、次の 2 つの部分が含まれます。
- ndarray データ自体。
- データを説明するメタデータ。
Numpy 配列の利点:
- Numpy 配列は通常、同じ種類の要素で構成されます。つまり、配列内のデータ項目は同じ型です。これには、配列要素が同じ型であることがわかっているため、データを格納するために必要なスペースのサイズをすばやく決定できるという利点があります。
- Numpy 配列は、配列全体を処理するためにベクトル化された操作を使用できますが、これはより高速ですが、Python リストは通常、リストをトラバースするためにループ ステートメントを使用する必要があり、操作効率は比較的低くなります。
- Numpy は最適化された C API を使用しており、操作速度が高速です。
ベクトル化とスカラー化の操作については、以下の参考例を比較すると違いがわかります。
Python のリストを使用して、ループ トラバーサル操作を実行します。
def pySum():
a = list(range(10000))
b = list(range(10000))
c = []
for i in range(len(a)):
c.append(a[i]**2 + b[i]**2)
return c
%timeit pySum()
Out[]:
10 loops, best of 3: