数据可视化可以提供对数据的直观感受,这个有时是很难通过表格的形式把握到的。本文将介绍分类问题的可视化方法。
数据可视化的第一步就是获取数据,下面是用“岩石vs水雷数据集”为例,展示数据获取方法。
1 import pandas as pd 2 3 target_url = ("https://archive.ics.uci.edu/ml/machine-learning" 4 "-databases/undocumented/connectionist-bench/sonar/sonar.all-data") 5 6 df = pd.read_csv(target_url, header=None, prefix='V') 7 8 print("数据集规模:",df.shape) 9 print("\n数据集类型:\n",df.get_dtype_counts()) 10 print(df.describe())
运行结果如下: