Datos sala de estudio de análisis segunda semana base de datos · Python 0722-0728

Directorio artículo

  1. Numpy (Numerical Python)
  2. pandas
  3. suplemento

Numpy (Numerical Python)

Python es una potente base de datos que se utilizan fundamentalmente para la realización de matrices multidimensionales, que ofrece una serie de funciones de biblioteca que se puede utilizar para calcular el procesamiento de matriz, todo tipo de tareas matemáticas imagen calculados (por ejemplo, cálculo), es un pitón rápido alternativo basado en MATLAB. A continuación se muestra la porción funcional puede ser alcanzado por bloque de código Numpy:

# Crear una matriz mediante NumPy matriz
de importación numpy NP AS
Data np.array = ([1,2,3,4,5,6,7,8,9,10]) para generar una matriz unidimensional #
data_d = np.array ([ [1,2,3], [3,4,5]]) para generar matriz bidimensional #
d1 = np.zeros (10, dtype = int) # 10 genera una longitud, el valor de todas array 0
d2 = np. queridos (10, dtype = int) # 10 genera una longitud, el valor de todas array 1
d3 = np.arange (0,10,1) # genera [0,10], el intervalo de la serie de datos 1
d4 = np. ojo (3) # 3 * 3 matriz generadora
d5 = np.random.randint (0,10,10) # longitud de 10 generado de forma aleatoria, el valor entre array [0,10]

# Numpy utilizando estadística descriptiva calculado índice (diagrama esquemático parte de los detalles se puede hacer referencia a la presente memoria)
de numpy importación Promedio, mediana
de scipy.stats importación MODO
data_mean = Mean (Data) 
data_median = Mediana (Data)
DATA_MODE MODE = (Data)

pandas

Es una herramienta potente para el análisis de datos estructurados fijados; Numpy se basa en su uso (para proporcionar una operaciones de la matriz de alto rendimiento); para análisis de datos y la minería de datos, los datos también proporciona una funcionalidad de limpieza. A continuación se muestra la porción funcional puede ser alcanzado por bloque de código Numpy:

Uso pandas # Crear y Serie DataFream
importación PANDAS DP como
datos = pd.Series (100, índice = rango (. 4)) es un índice construido #Series índice de matriz
d1 = pd.Series (np.random.rand (5) , índice = lista ( "ABCDE" )) # índices personalizados
# pandas.DataFrame (datos = Ninguno, índice = ninguno, Columnas = Ninguno, DTYPE = Ninguno, Copiar = False)
D2 = pd.DataFrame (np.random.randn (8,5)) * 5 # 8 crea datos aleatorios matriz
d3 = pd.read_csv () # archivo csv leer 
d4 = pd.read_excel () # leer archivo de Excel

# Pandas utilizando estadística descriptiva calculado índice (diagrama parte esquemática de detalles se puede hacer referencia a la presente memoria)
data_var = data.var ()
data_std = data.std ()
data_iqr data.quantile = (0,75) -data.quantile (0.25)

suplemento

# El uso de códigos de conexión a la base de datos para lograr Python
pymysql importación # para una versión con base de datos del servidor MySQL en Python3.x
(host = 'Su dirección de base de datos', user = 'nombre de usuario', contraseña = conn = pymysql.connect' contraseña 'db =' nombre de la base de datos 'charset =' UTF-8 ') # se conecta a una base de datos local
sql_query1 =' '' select * from tabla1 donde ... '' '#sql códigos numéricos proporcionar
datos = pd.read_sql (sql_query1, con = datos conn) # extracto leen sql
 

 

Publicado siete artículos originales · ganado elogios 3 · Vistas 1669

Supongo que te gusta

Origin blog.csdn.net/CCESARE/article/details/97624343
Recomendado
Clasificación