Pythonデータ分析の実践

著者: 禅とコンピュータープログラミングの芸術

1 はじめに

データ分析は、人々がデータを収集、整理、処理するプロセスに由来しており、「データ駆動型」という概念の産物でもあります。データ分析には通常、データの取得、クリーニング、計算、視覚化などの複数のリンクが含まれており、その中で視覚化がデータ分析の鍵となることがよくあります。Python 言語はデータ サイエンスの分野で重要な位置を占めています。統計、機械学習、データ可視化などの分野で強力なライブラリを備えており、データ分析作業を効率的かつ迅速に実行できます。この記事では、主に numpy、pandas、matplotlib、seaborn、scipy、statsmodels、scikit-learn、tensorflow などのライブラリの使用を含む、Python で一般的に使用されるツールキットに焦点を当てます。

2. データ構造と計算

2.1 データ構造

Python のデータ構造は、Java などの他のプログラミング言語と非常に似ています。一般的に使用されるデータ構造の一部を次に示します。

  1. リスト (リスト): リストは、さまざまなタイプのオブジェクトを格納できる順序付けられたシーケンスであり、その要素にはインデックスを介してアクセスできます。このリストでは、操作の追加、削除、変更、確認がサポートされています。例は次のとおりです。

    lst = ['apple', 'banana', 'orange']
    print(lst[1]) # 输出'banana'
    
    lst.append('grape') # 添加元素到列表尾部
    lst.insert(2, 'pear') # 在索引2位置插入新元素
    del lst[2] # 删除索引值为2的元素
    
    if 'apple' in lst:
        lst.remove('apple') # 从列表中删除第一个'apple'元素
    
    for i in range(len(lst)):
        print(i, lst[i]) # 遍历列表并输出索引和元素值
    
    # 合并两个列表
    new_ls

おすすめ

転載: blog.csdn.net/universsky2015/article/details/132255970