Minería de datos de Python: aplique la función de detección en el paquete toad para obtener estadísticas descriptivas

Con el advenimiento de la era del big data, muchas tareas requieren minería de datos para descubrir leyes más favorables, evitar riesgos o descubrir valor comercial. Por ejemplo, en el campo de los pagos, al extraer los datos de transacciones de los comerciantes, se analiza si los comerciantes tienen riesgos como fraude, fraude, apuestas y retiro de efectivo. Para los comerciantes riesgosos, ciérrelos a tiempo o interrumpa la transacción en tiempo real para proteger la seguridad de sus fondos personales. En el campo financiero, a través de la minería de datos, las preferencias y retratos de los clientes se utilizan para ampliar nuevos clientes y retener a los antiguos. Este artículo explorará con usted la función toad.detector.detect que se usa comúnmente en la minería de datos.


  

1. Instale el paquete sapo

  
Primero abra cmd, instale el paquete toad, la declaración de instalación es la siguiente:

pip install toad

Si la instalación es exitosa, los resultados se mostrarán de la siguiente manera:
  
inserte la descripción de la imagen aquí

  
  

2. Importar datos

  
Antecedentes: es necesario analizar la información básica y la información de compras de 530.000 clientes para construir retratos de compras de los clientes, predecir las tendencias de compra de los clientes y realizar un marketing preciso.
  
Antes del análisis del retrato, es necesario contar con estadísticas descriptivas sobre la información básica y la información de compras de los clientes. En este artículo se extraen algunos indicadores para la visualización de indicadores de estadísticas descriptivas, el método de análisis específico es el siguiente. Luego importe los datos a analizar.

#读取数据
import os
import toad
import numpy as np
import pandas as pd

os.chdir(r'F:\公众号\70.数据分析报告')
date = pd.read_csv('BlackFriday.csv', encoding='gbk')
date.head(5)

Las primeras filas de datos se muestran de la siguiente manera:
  
inserte la descripción de la imagen aquí

  
  

3. Aplicar la función de detección para calcular estadísticas descriptivas.

  
Finalmente, llame a la función de detección en la biblioteca toad para realizar un análisis estadístico descriptivo de datos, la declaración es la siguiente:

#计算描述性统计值
describe = toad.detector.detect(date)
describe

El resultado es el siguiente:
  
inserte la descripción de la imagen aquí

  
La columna de índice contiene nombres de variables como ID de cliente, ID de producto, sexo, edad, categoría de ciudad, años de vida en la ciudad actual, categoría de producto e información de compra.
  
La columna de tipo muestra el tipo de datos de cada variable, incluido el tipo int, el tipo de objeto, el tipo flotante, etc.
  
La columna de tamaño describe la longitud de cada variable.
  
La columna que falta describe la tasa que falta para cada variable.
  
La columna única describe la cantidad de valores para cada variable.
  
Las siguientes columnas describen la media, la desviación estándar, el valor máximo, el cuantil y otra información de los datos.
  
Para mostrar más claramente el valor estadístico correspondiente a la variable, exporte el resultado a un archivo csv, la declaración específica es la siguiente:

describe.to_csv('describe.csv', encoding='gbk')

Los resultados obtenidos son los siguientes:
  
inserte la descripción de la imagen aquí
  
Hasta ahora, se ha explicado la aplicación de toad.detector.detect en Python para la minería de datos y los estudiantes interesados ​​pueden darse cuenta de la imagen por sí mismos.
  
[ Acceso gratuito al grupo por tiempo limitado ] El grupo proporciona información de reclutamiento relacionada con el aprendizaje de Python, el juego con Python, el modelado de control de riesgos, la inteligencia artificial y el análisis de datos, excelentes artículos, videos de aprendizaje y también puede intercambiar problemas relacionados encontrados en el aprendizaje y trabajar. Los amigos que lo necesiten pueden agregar el ID de WeChat 19967879837 y agregar tiempo para anotar los grupos a los que desean unirse, como el modelado de control de riesgos.
  
Quizás te interese:
Dibujar a Pikachu en PythonUsar
Python para dibujar nubes de palabrasReconocimiento
facial de Python: eres el único en mis ojosPython
dibuja un hermoso mapa de cielo estrellado (hermoso fondo)
Usa la biblioteca py2neo en Python para operar neo4j y crear un mapa de asociaciónPython
Colección de código fuente de confesión romántica (amor, rosa, muro de fotos, confesión bajo las estrellas)

Supongo que te gusta

Origin blog.csdn.net/qq_32532663/article/details/132395893
Recomendado
Clasificación