Serie de algoritmos de regresión y agrupamiento ①: resumen conceptual

Tabla de contenido

introducir

algoritmo de regresión

Algoritmo de agrupación

El contenido de la serie.


introducir

Contenido de este capítulo:

说明线性回归的原理
应用LinearRegression或SGDRegressor实现回归预测
记忆回归算法的评估标准及其公式
说明线性回归的缺点
说明过拟合与欠拟合的原因以及解决方法
说明岭回归的原理即与线性回归的不同之处
说明正则化对于权重参数的影响
说明L1和L2正则化的区别
说明逻辑回归的原理
知道逻辑回归的应用场景
说明分类(主要针对二分类)问题的评估标准
应用classification_report实现精确率、召回率计算
应用roc_auc_score实现指标计算
应用joblib实现模型的保存与加载
说明K-means算法原理
说明K-means的性能评估标准轮廓系数
说明K-means的优缺点

Mientras analizamos en profundidad los algoritmos de regresión y agrupamiento, comencemos con la justificación, las aplicaciones comunes y los ejemplos de cada algoritmo.

algoritmo de regresión

1. Justificación: Los algoritmos de regresión tienen como objetivo modelar la relación entre las características de entrada y las variables de salida. Este modelo suele ser una función que se puede utilizar para predecir o estimar la producción continua. Básicamente, estamos tratando de encontrar una función que se ajuste mejor a los puntos de datos conocidos para poder hacer predicciones dadas las nuevas características de entrada.

2. Algoritmos comunes:

  • Regresión lineal: este es uno de los algoritmos de regresión más simples que asume una relación lineal entre las características de entrada y las variables de salida. El objetivo del modelo es encontrar una línea recta de mejor ajuste que minimice la diferencia entre los valores previstos y reales.
  • Regresión polinómica: la regresión polinómica nos permite utilizar una función polinómica para ajustar los datos cuando una relación lineal no se ajusta bien a los datos.
  • Regresión de cresta y regresión de lazo : estos algoritmos se utilizan para abordar problemas de multicolinealidad donde existen correlaciones entre características.

3. Aplicación: Los algoritmos de regresión se utilizan ampliamente en diversos campos, como por ejemplo:

  • Finanzas: Predicción de precios de acciones, tipos de cambio de divisas, etc.
  • Médico: Predecir el estado de salud de un paciente o el riesgo de enfermedad.
  • Pronóstico del tiempo: pronostica temperatura, precipitaciones y más.
  • Análisis de mercado: Previsión de ventas, cuota de mercado, etc.

4. Ejemplo: suponga que está utilizando la regresión lineal para predecir los precios de la vivienda. Recopilas diversas características de la casa (como tamaño, número de dormitorios, ubicación, etc.) y su precio. Luego, el modelo de regresión lineal intenta encontrar una función lineal que asigne estas características a los precios de la vivienda para que pueda estimar los precios en función de las características de la nueva casa.

Algoritmo de agrupación

1. Principio básico: un algoritmo de agrupamiento es un método de aprendizaje no supervisado que intenta agrupar puntos de datos en grupos similares de modo que los puntos de datos dentro de un grupo sean similares entre sí, mientras que los puntos de datos entre diferentes grupos sean diferentes. La idea básica es encontrar estructuras o patrones ocultos en los datos.

2. Algoritmos comunes:

  • Agrupación de K-Means : este es uno de los algoritmos de agrupación más comunes. Divide los puntos de datos en K grupos y el centro de cada grupo está determinado por la media de sus miembros.
  • Agrupación jerárquica: este algoritmo no necesita especificar la cantidad de grupos de antemano, pero construye una estructura jerárquica que agrega gradualmente puntos de datos en grupos de diferentes niveles.
  • DBSCAN (agrupación espacial de aplicaciones con ruido basada en densidad): agrupación basada en densidad, que puede identificar grupos de formas irregulares.

3. Aplicación: Los algoritmos de agrupamiento se utilizan ampliamente en diversos campos, como por ejemplo:

  • Segmentación del mercado: agrupar a los clientes en grupos para comprender mejor sus necesidades y comportamiento.
  • Análisis de redes sociales: descubrimiento de estructuras comunitarias en las redes sociales.
  • Segmentación de imágenes: agrupar píxeles de una imagen en regiones con características similares.
  • Detección de anomalías: identificación de anomalías o valores atípicos en los datos.

4. Ejemplo: suponga que está utilizando la agrupación de K-medias para analizar el comportamiento de compra de los clientes. Puede segmentar a los clientes en diferentes grupos según su historial de compras, preferencias y hábitos de gasto para adaptar mejor las estrategias de marketing o recomendar productos.

El contenido de la serie.

La serie de algoritmos de regresión y agrupamiento incluirá lo siguiente:

  1. regresión lineal
  2. Desajuste y sobreajuste
  3. Regresión de cresta
  4. Regresión logística y clasificación binaria
  5. Guardado y carga del modelo.
  6. Algoritmo K-means para aprendizaje no supervisado

La serie de contenido tendrá los principios de algoritmo correspondientes, los principios matemáticos correspondientes y todo el proceso sobre cómo usar el código Python para implementar.

Guess you like

Origin blog.csdn.net/qq_60735796/article/details/132710757