数据分析与挖掘基础环境安装与使用
整个数据挖掘基础阶段会用到Matplotlib、Numpy、Pandas、Ta-Lib、jupyter等库,为了统一版本号在环境中使用,将所有的库及其版本放到了文件requirements.txt当中,然后统一安装
新建一个用于数据挖掘环境的虚拟环境:
virtualenv -p python3 ai #把虚拟环境安装到指定文件夹下
启用虚拟环境:
workon ai
具体虚拟环境的安装于使用方法可参考文章:linux系统环境下虚拟环境virtualenv安装与使用
准备requirements.txt文件
matplotlib==2.2.2 <-- 绘图库
numpy==1.16.2 <-- 数值计算库
pandas==0.20.3 <-- 数据处理
TA-Lib==0.4.17 <-- technical analysis技术分析库
tables==3.4.2 <-- 存储HDF5类型的数据
jupyter==1.0.0 <-- 编码平台(网页版IPython)
首先安装numpy
Ta-Lib安装会出现问题,需要先安装依赖库,按照以下步骤安装:
# 获取源码库
sudo wget http://prdownloads.sourceforge.net/ta-lib/ta-lib-0.4.0-src.tar.gz
# 解压进入目录
tar -zxvf ta-lib-0.4.0-src.tar.gz
cd ta-lib/
# 编译安装
sudo ./configure --prefix=/usr
sudo make
sudo make install
# 重新安装python的TA-Lib库
pip install TA-Lib
安装剩下的库
使用pip命令安装,注意requirements.txt放置在当前文件夹下
pip install -r requirements.txt
查看虚拟环境下安装的所有包
pip freeze