[Compartir tecnología] Aplicación del aprendizaje automático en la dirección de negociación cuantitativa: estrategia de selección de valores de múltiples factores basada en la red neuronal

Este artículo autor original: Oasis, publicado después de la autorización.

1. Fondo de selección de valores multifactorial

Las estrategias comerciales cuantitativas no son más que tres puntos: tiempo, selección de acciones y control de almacén. El momento es la estrategia de negociación de arbitraje a corto plazo y la selección de valores es una estrategia de negociación a mediano y largo plazo. El objetivo es superar el índice en el mediano y largo plazo y obtener el alfa de retorno de exceso de mercado. La clave para la selección de valores de múltiples factores es encontrar la correlación entre el factor y el rendimiento de las acciones, es decir, el factor con una fuerte capacidad para predecir el rendimiento. Generalmente adopte los siguientes pasos:

Los modelos multifactoriales tradicionales a menudo se basan en el juicio subjetivo de los inversores y el razonamiento lógico al construir las características del factor a gran escala. Los modelos cuantitativos, como el aprendizaje automático, basados ​​en algún mecanismo, construyen un modelo con características de aprendizaje adaptativo y automático, que se usa ampliamente en la construcción de modelos multifactoriales. En comparación con los clasificadores de aprendizaje automático como SVM y Regresión logística, el aprendizaje profundo puede aprender características de factores más útiles al construir modelos de aprendizaje automático con muchas capas ocultas y datos de entrenamiento masivos. Por lo tanto, el "modelo profundo" es solo un medio, y nuestro objetivo final es utilizar redes neuronales profundas para realizar un "aprendizaje de características" multifactorial, mejorando así la precisión de la clasificación o predicción.

En segundo lugar, el modelo de características-stock de múltiples factores

El grupo de valores en el que se basa nuestra selección de valores es un stock constitutivo de CSI 500. De acuerdo con los indicadores financieros y el desempeño del precio de las acciones de estas compañías, cinco factores de ganancia, tecnología, crecimiento, valoración y escala se construyen como insumos modelo:

盈利 因子 技术 因子 BPSCloseAdj / OneMonthMaxCloseAdjDividend Yield1 Month returnDividend Yield Last Year1 Month RSIEPS1 Month ADRSales / Enterprise Value1 Month Montage AverageFCFF / Enterprise Value3 Month returnRokurn on P / B1 year daily SkewnessReturn on P / E1 MonthTic Overtime AverageRO Overric FactureRO

规模 因子 估值 因子 成长 因子 Acciones de mercado libresAcca_Operating Finance InvestmentNet Profit GrowthMarket Total CapitalAsset Deterioro Pérdida a ingresos brutos Operación Crecimiento de ganancias Registro de mercado Capital Capital total Cajas de ventas / Ingresos operativos Crecimiento de ingresos Operación CFO / NOIR Crecimiento de ingresos P / BROE Crecimiento P / EChange Crecimiento de ganancias netas Crecimiento de beneficios netos

En función de los factores anteriores, utilizamos el modelo de red neuronal para conocer las características del modelo, a fin de seleccionar las 50 acciones principales con el mejor rendimiento del mercado y construir una cartera de inversiones óptima.

Tres, modelo de red neuronal profunda de construcción

La profunda red neuronal del modelo ha sido pasada de moda, hay innumerables publicaciones en el KM y la red, y aquí hay solo una breve introducción y ninguna expansión. Una red neuronal profunda consiste en una red multicapa que consiste en una capa de entrada, una capa oculta (multicapa) y una capa de salida. Solo los nodos en las capas adyacentes están conectados, y los nodos en la misma capa y capas cruzadas no están conectados entre sí; se forman combinando características de bajo nivel Representación más abstracta de alto nivel de categorías o características de atributos. Al construir modelos de aprendizaje automático con muchas capas ocultas y datos de entrenamiento masivos, para aprender características más útiles y, en última instancia, mejorar la precisión de la clasificación o predicción. La ventaja de este modelo es que no necesita hacer demasiado procesamiento y detección de datos de características. Si se arroja al cuadro negro del modelo, puede entrenar mejores efectos que los modelos de máquina como Boosting o árboles, especialmente en escenarios con datos suficientes y muchas características. Puede ejercer su poder.

Las deficiencias también son obvias: 1) El cuadro negro modelo no tiene una explicación intuitiva del significado comercial para las características. 2) Es fácil causar inestabilidad de gradiente, como explosión de gradiente o desaparición de gradiente, y es difícil estabilizar la convergencia de entrenamiento, a menudo alcanzando un óptimo local o cayendo en un punto de silla de montar. 3) El costo de cálculo es alto y generalmente se calculan grandes cantidades de datos en la GPU. 4) Todavía es más adecuado para la formación de datos de imágenes: los datos financieros son en su mayoría lineales y no pueden aprovechar la capacidad de las redes neuronales "profundas" para adaptarse a datos no lineales. Este modelo se basa en el marco de Keras para completar la capacitación y las pruebas.

Cuarto, el proceso de estrategia modelo

Primero determine el período de prueba retrospectiva: la puntuación del factor de característica de stock de tres años se usa como los datos de entrenamiento de la red neuronal, y el período de tres años es el período de ventana de entrenamiento. El período de ajuste de posición es de 20 días, y los datos del factor de existencias en todo el mercado el día del intercambio de posición se utilizan como conjunto de datos de prueba para predecir la próxima clasificación de existencias. Construya el conjunto de muestras de entrenamiento de factores y el conjunto de pruebas correspondientes. Al construir la etiqueta de factor técnico, debe tenerse en cuenta que para el día de negociación a intervalos de 10 días, el precio debe calcularse después de la tasa de rendimiento del día de negociación de 10 días (calculado por adjunto), y finalmente cubrir la tasa de rendimiento CSI 500 para calcular el rendimiento alfa.

Diagrama esquemático del retroceso del entrenamiento

Variable objetivo: dividir las acciones en grupos fuertes y débiles de acuerdo con el rendimiento del mes actual en la fecha de la bolsa de valores (dos categorías, 0-1):

Modelo de estrategia: construya una red neuronal profunda con 4 capas ocultas y configure el clasificador softmax en la última capa. Supervise y entrene toda la red neuronal, ajuste la capa oculta, el número de nodos (256-128-32-16), la función de activación (relu), la función de pérdida (entropía cruzada) y otros parámetros del modelo, extraiga las características principales de los factores.

Resultado de la estrategia: pronostique el rendimiento de retorno de todos los ciclos de intercambio de existencias en el conjunto de existencias, clasifique las existencias de acuerdo con la salida del puntaje de predicción de probabilidad del modelo por la red neuronal profunda y seleccione las existencias del 10% superior (TOP50) como la combinación óptima de existencias.

V. rendimiento del modelo

De acuerdo con la clasificación de puntuación de predicción probabilística de la salida del modelo, primero seleccione las acciones TOP50 para crear una combinación de acciones de igual peso y compárela con el índice CSI 500.

La línea verde representa el efecto de rendimiento acumulado (valor neto) de la combinación de acciones top50 seleccionada por el modelo y la combinación de índice CSI 500 de línea gris (rendimiento amplio del mercado). Se puede ver que la combinación de acciones óptima seleccionada por el modelo de selección de acciones multifactor superó con creces el mercado grande Índice La cola de los datos históricos utilizados en ese momento se puso al día con el colapso del mercado de valores de 15 años. Durante el colapso del mercado de valores, las acciones de cartera óptimas seleccionadas por el modelo de selección de valores de múltiples factores encontraron riesgos significativos y tuvieron un mejor desempeño que el índice de mercado más amplio.

El siguiente es el rendimiento de la cartera de acciones de igual peso construida por las 50 mejores acciones: el alfa anualizado (relativamente mejor que la tasa de rendimiento del mercado) alcanza el 25%, y el índice de nitidez es tan alto como 1.22. Por supuesto, este modelo es un entorno de mercado más ideal, establecido bajo la premisa de casi ningún costo de fricción, y el buen rendimiento es inevitable.

Estadísticas de rendimientoBacktestannual_return0.37annual_volatility0.29sharpe_ratio1.22calmar_ratio0.75stability_of_timeseries0.83max_drawdown-0.49omega_ratio1.24sortino_ratio1.67skew-0.84kurtosis3.75tail_ratio0.17betata1.01.05tata1.01.01.05ta_alta1.05.01.01

6. Breve introducción de la estrategia de construcción de cartera de acciones.

En general, cuando una compañía de fondos construye un índice cuantitativo o un producto de gestión de patrimonio, la selección de las acciones óptimas no está completa. También es necesario igualar el peso de las acciones, igualar la moneda de los bonos y otras herramientas de inversión para cubrir el riesgo y controlar el VAR de la cartera a un precio razonable. Como se esperaba, no se hará ninguna introducción aquí:

También hay un método popular llamado Smart Beta, que es utilizado por algunos índices cuantitativos de fondos convencionales. En esencia, ya no es seguir de cerca el índice, sino optimizar la selección de valores y la disposición de ponderación durante el proceso de compilación del índice. No es una simple inversión pasiva en el índice, sino una inversión Beta con pensamiento y personalidad. Estrategia. De acuerdo con China Securities Index Company, ha obtenido rendimientos excesivos que superan el índice ponderado de valor de mercado tradicional. Combina las ventajas de la inversión activa y la inversión pasiva, puede romper las restricciones del índice ponderado por valor de mercado, proporcionar a los inversores estrategias de cartera más flexibles y diversificadas, y gestionar mejor el riesgo de la cartera, por lo que cada vez es más profesional. Los inversores centraron su atención en las estrategias de inversión Smart Beta basadas en factores como las fluctuaciones de los precios de las acciones, las capacidades de pago de dividendos o el rendimiento de la empresa.

Siete: conclusión

La esencia del modelo de acciones de múltiples factores no es más que el proceso que los investigadores de la industria que usan algoritmos de aprendizaje automático para reemplazar a los corredores observan los indicadores de acciones, los indicadores de rendimiento de la compañía, los informes de análisis de la industria y otros datos para elaborar estrategias de selección de acciones y otros procesos de toma de decisiones. El modelo de clasificador que se usa a continuación es que la clave es encontrar una biblioteca de factores de expansión de factores de características que tenga un fuerte efecto en la predicción del precio de las acciones. Apoye las decisiones de selección de valores. Por supuesto, quien tiene el "factor" de acciones que otros no pueden comprender puede encontrar fácilmente el "alfa" del mercado. Si tenemos un procesador de datos con suficiente poder de cómputo para capturar todas las señales e indicadores en el mercado de valores en factores en tiempo real y hacer una estrategia de selección de valores, ¿pueden reemplazarse las posiciones de los investigadores de la industria de corretaje? Cuando el mercado es lo suficientemente transparente, la información del mercado se puede interpretar completamente, ¿aún hay alfa para ganar?

De hecho, la clave de la intención original de escribir este artículo es permitir que todos comprendan cómo algunos de los índices cuantitativos comunes, los productos de gestión de patrimonio y la estrategia modelo detrás del software de selección de acciones están actualmente en el mercado. Tampoco es para demostrar cuán poderosa es la red neuronal en la selección de acciones. Si este es el caso, el rendimiento de todos los fondos cuantitativos en el mercado no será tan insatisfactorio, y algunos ni siquiera se ejecutarán en el mercado. La escena real del comercio de acciones es mucho más complicada, especialmente en el contexto de los frecuentes incidentes de "cisne negro" en los últimos años, o la frase: "El mercado de valores es arriesgado, y debe ser cauteloso al ingresar al mercado".

Supongo que te gusta

Origin blog.csdn.net/qq_42933419/article/details/105098993
Recomendado
Clasificación