Para el sector financiero, el valor real de aprender federal es cómo encarnar?

Plomo: En los últimos dos años, la tecnología de aprendizaje Federal se está desarrollando rápidamente. Como paradigma de aprendizaje automático distribuido, el aprendizaje federal puede efectivamente resolver el problema de los silos de datos, por lo que los participantes no hacen parte en los datos de modelos conjuntos, basado en datos de romper los silos de vista técnico. Sin embargo, en la actualidad esta tecnología en muchas empresas encuentran dificultades de aterrizaje, InfoQ describir cada una de las principales compañías de cómo practicar el aterrizaje de la tecnología en el sector financiero a través tema.

En el campo de la inteligencia artificial, la práctica de la tecnología, especialmente de aterrizaje a gran escala es un tema de gran preocupación para todos los desarrolladores. Sin embargo, en el proceso real de aterrizaje, siempre se enfrentan con diversos problemas. Sólo los datos más básicos, la mayoría de las empresas se habían convertido en el cuello de botella de la tecnología no se puede lograr un avance: la mala calidad de los datos - como muchas etiquetas difíciles de recopilar datos, o incluso ninguna etiqueta; descentralizada de datos - los datos de cada aplicación es diferente, difícil de cruzar la cooperación-organizacional entre los datos. Con las leyes y regulaciones sobre los datos nacionales cada vez más estrictas, el problema de los datos se hace más difícil, y el estudio federal de emergencia de la viabilidad de permitiendo a los desarrolladores para encontrar una solución al problema.

En los últimos años, muchas empresas nacionales en estudio federal de la I + D, y ha entrado en el piso práctico etapa. En este artículo, InfoQ habló con el Administrador General Adjunto Chen Tianjian artificial Ministerio de Inteligencia banco de micro-pública, el aprendizaje de todo tipo de métodos Federal son la comprensión en profundidad de la práctica de los bancos de micro-públicas.

 

estudio federal de aplicación en el sector financiero

Actualmente, estudio federal se ha hecho en algunas áreas clave del progreso económico, tales como el modelado contra el lavado de dinero conjunta, modelando el control conjunto el riesgo de crédito, el modelado de fijación de precios diferenciada conjunta, el modelado de valor para el cliente conjunta. En comparación con otras áreas, la gestión financiera y de control de los datos más rigurosos, más énfasis en la privacidad de los datos, y por lo tanto más necesidad de abordar las áreas problemáticas de los silos de datos a través de medios técnicos.

Chen dijo Tianjian la gestión del riesgo de crédito, la evaluación del riesgo de suscripción están aprendiendo más adecuado para aplicaciones financieras federales. En comparación con otras áreas, aplicaciones financieras y un mayor enfoque en la cuantificación del riesgo, después de todo, el precio del riesgo es a menudo un componente importante de los precios de los productos financieros. modelo de cuantificación del riesgo estudio federal, por las dimensiones de datos de extensión basa, mejorar significativamente la capacidad de cuantificar el riesgo, lo que reduce los precios globales de los productos financieros, mejorar aún más los servicios financieros a la comunidad en términos de disponibilidad.

 

Tres sistema de clasificación federal para la práctica de aprendizaje

sistema de clasificación de aprendizaje federal, incluyendo:

  • aprendizaje lateral Federal, los datos de características de usuario de dos conjuntos (X1, X2, ...) que se superpone parte es grande, y el usuario (U1, U2, ...) porción de solapamiento es pequeño;

  • estudio Federal longitudinal, dos conjuntos de datos de usuario (U1, U2, ...) que se superpone parte es grande, y la característica de usuario (X1, X2, ...) más pequeñas partes que se solapan;

  • aprendizaje Federal de transferencia, y el aprendizaje a través del aprendizaje de transferencia federal, para resolver el usuario dos conjuntos de datos (U1, U2, ...) y el usuario cuenta con la superposición (X1, X2, ...) son parte relativamente pequeña del problema.

sistemas de clasificación diferentes, adecuadas para resolver el problema bajo diferentes escenarios en el sector financiero.

 

aprendizaje lateral Federal

En primer lugar, vamos a ver la aplicación práctica del estudio transversal federal. Chen Tianjian dijo transversal estudio federal de las características son las mismas características de los datos, diferente ID de la muestra, una aplicación común en el sector financiero es el tratamiento AML banco.

Anti-Lavado de dinero juega un papel importante en las operaciones diarias del banco. Sin embargo, para determinar si la operación de lavado de dinero es aburrido y propenso a errores. Tradicionalmente, los bancos utilizan un modelo basado en reglas para filtrar esos registros no obvias y lavado de comprobar manualmente los registros restantes. Dicho modelo basado en reglas puede proporcionar mucha ayuda, pero debido a la pequeña área de cobertura, por lo que una revisión manual todavía pasará mucho tiempo. Además, aunque el modelo tradicional en el caso convencional conocido funciona bien, pero por circunstancias desconocidas, como una nueva forma de blanqueo de dinero, etc., pero parece una falta de conciencia.

Y transversal estudio federal, las instituciones no necesitan construir modelos físicos comparten un modelo común, que puede resolver con eficacia las pequeñas áreas de muestra, problemas de baja calidad de datos. Por ejemplo, sin compartir datos de usuario, banco público micro-banco estableció una serie de lavado de conjunto contra el dinero modelo, a través de pruebas de simulación, el modelo implicado más bancos, mayor es su rendimiento.

Esta aplicación se utiliza para entrenar el modelo federal llamada homogénea de regresión logística (Homo-LR). Todos los bancos ofrecen el mismo tipo de datos, lo que significa que tienen las mismas características, pero con diferentes números de muestras. Con esta combinación, todo el conjunto de datos incluye un gran número de casos positivos, y al modelo de rendimiento bueno, principio Homo-LR es la siguiente:

En cada iteración, cada lado a través de su propia formación modelo de datos y re-modelar sus derechos o se envía a una tercera parte llamada el gradiente del Inquisidor. Todos estos modelos serán los pesos del árbitro o resumir gradiente, a continuación, actualizar de nuevo a las partes. Cuando el modelo es entrenado por co-propietario de los datos de las partes nunca salir de su propia base de datos. proceso de inferencia es también fácil de entender y ejecutar:

De esta manera, mejora en gran medida el rendimiento del modelo. AUC modelo lr aumentó en un 14 por ciento, lo que reduce el número y la dificultad de revisión manual, comparar el antes y después de usar el modelo de abajo muestra los resultados:

 

estudio longitudinal Federal

Seguido por estudio longitudinal federal, las características de diferentes características de los datos, la misma ID de la muestra, este método puede ser aplicado en el control de crédito viento.

En los últimos años, con el apoyo de la política nacional, préstamos para pequeñas empresas y microempresas son cada vez más atención, se ha convertido en un importante indicador del potencial y las capacidades de desarrollo del banco. Dado que los riesgos son demasiado altos, muchos bancos son reacios a préstamos a micro y pequeñas empresas, cómo evitar riesgos y reducir la tasa de morosidad de las pequeñas y micro empresas es particularmente importante.

Actualmente, la mayoría de los bancos de lista blanca mecanismo de gestión de riesgos de pequeños préstamos para microempresas, mientras que la lista blanca es por las reglas de detección y los modelos de riesgo de alcanzar. Reglas y modelo de datos de riesgo relacionada depende de micro y pequeñas empresas y de control de personas. Para la gestión del riesgo, los datos relacionados pueden incluir el informe del banco central de crédito, impuestos, de reputación, financieros y otros activos intangibles. Sin embargo, para el banco, de hecho, sólo el informe de crédito del banco central, obtener otra información útil. estudio longitudinal federal proporciona una manera viable para el entrenamiento del modelo: No a la fuga de datos a otras personas, y puede alcanzar es equivalente o similar al efecto del modelo de datos completa.

Por ejemplo, si el banco tiene una etiqueta Y y la función de informes de crédito X3 Banco Central, la empresa cuenta con la cooperación de datos relacionados X. Debido a la falta de información Y, empresas asociadas no pueden entrenar el modelo, pero debido a problemas de privacidad, los datos no pueden ser pasados ​​directamente a la banca pública X micro, a través de la Federal aprender, encontrar la intersección entre los dos, como el número de identificación del contribuyente, pero elementos de trabajo no pueden dejar que la otra parte sabe que el uso de la tecnología de cifrado RSA, las empresas pueden cooperar para llegar a salvo la información relevante (en lugar del original de datos de usuario) interactúan con los resultados intermedios cifrados. Chen Tianjian dijo que el banco es ahora capaz de combinar la etiqueta atribuye el importe de la factura y los datos de crédito del banco central y otra modelización conjunta, la pequeña micro-empresa de control de riesgo del modelo discriminación --AUC de la República de China (para distinguir un modelo para medir la calidad de una muestra de los criterios de evaluación ) en un 12%.

Mediante el uso de DESTINO (descrito en detalle a continuación, que es un micro-bancos públicos plataforma de aprendizaje de código abierto de la Federación), bancos públicos y micro-empresa del tren modelo de cooperación entre sí. modelo de formación federal llamada regresión logística heterogénea (hetero-LR). La regresión logística con diferente convencional, Hetero-LR mantener su modelo, y utilizando los datos de entrenamiento respectivos, usando el resultado cifrado intermedio para interactuar, y el modelo final se resumen gradiente, actualiza el modelo en cada lado. Esto mejora el rendimiento del modelo, en comparación con sólo con puntuación de crédito del banco central, el modelo AUC hetero-LR aumentó en un 12%. Con la mejora de los resultados del modelo, la tasa de malos préstamos disminuyó.

Por último, se trata de una caminata en la vanguardia de la tecnología de aprendizaje transferencia de ciencia y tecnología federal. Chen dijo que el aprendizaje Tianjian transferencia federal se encuentra todavía en fase de investigación, es un estudio longitudinal y transversal de un estudio federal federal mejorada, mejorar y, la aplicación industrial práctica unificar a desarrollarse más.

 

el estudio y la práctica de los bancos de micro-pública en tres etapas Federal

A lo largo de la mayor parte del desarrollo técnico en el campo de la ciencia y la tecnología, dos nodos importantes: uno es establecer normas técnicas, y la segunda es una práctica de aterrizaje a gran escala. Mejorar los estándares, permitiendo que más empresas están dispuestas a probar esta técnica, la práctica de la fase de aterrizaje a gran escala expondrá una gran cantidad de problemas, esta es la única manera de madurar la tecnología. Estos dos puntos se reflejan en el proceso de aterrizaje bancos micro-público en el estudio federal.

2018, las prácticas comerciales y la observación de la industria, Chen Tianjian donde el equipo encontró gran cantidad de datos necesarios para la formación de la IA realmente difícil de obtener, el control de datos dispersos en diferentes organizaciones, diferentes departamentos, "islas de datos" problema grave, junto con las políticas y regulaciones requisitos de privacidad y seguridad de datos hace que el intercambio de datos y la cooperación más difícil.

Para los puntos de dolor de negocios reales, encontraron que el aprendizaje federal es una solución eficaz. Desde una perspectiva global, ya que la legislación de protección de datos profundizado acelerar aún más el proceso, necesita la cooperación de grandes datos de co-regulación urgente estudio más, federal tiene un enorme potencial para el desarrollo. Desde 2018, relacionados con AI-Micro Focus del Banco de código abierto equipo de desarrollo de software de la teoría del aprendizaje basado en federal y someter al estudio federal del estándar internacional IEEE aprobada en 2018.

Chen Tianjian añadió que el desarrollo del aprendizaje federal para ir a través de tres etapas, a saber, la "fase de investigación y desarrollo Federal de la teoría del aprendizaje", "aplicaciones de volumen fase de aterrizaje", "fase de puesta a punto de aprender el valor de la Red Federal" y. Después de experimentar la primera fase del enfoque de la investigación teórica del estudio federal actual nos estamos moviendo hacia una aplicación embarcadero por lotes (Fase II).

En la primera etapa, explorar estudio federal es principalmente la investigación teórica y práctica a pequeña escala, aprender a construir un marco ecológico federal.

Desde 2018 hasta principios de 2019, Micro Focus del Banco Federal publicó una serie de documentos relacionados con el aprendizaje, el concepto del estudio federal, la teoría básica de la clasificación, tales como los principios básicos de la investigación sistemática y, al mismo tiempo, presentar al estudio federal del estándar internacional IEEE ganó en 2018 por lotes, después de la primera fase de exploración, para construir la teoría, herramientas, normas técnicas, multinivel estudio federal marco ecológico de aplicaciones industriales, y comenzó a Tencent, Huawei, Jingdong, los socios de la seguridad ecológica a unirse.

La segunda etapa, la Federal aprender más en el campo de la industria de la planta, la acumulación de casos, estudio ecológico federal amplió aún más.

A principios de 2019, Micro Focus del Banco oficialmente abierto de primer grado industrial de aprendizaje federal marco el destino del mundo (Federados de aprendizaje Enabler), y comenzó a tratar de aprender aplica a las operaciones financieras federales.

Con el estudio teórico en profundidad del estudio federal, los bancos de micro-públicas en el país, el Congreso Internacional llevaron a cabo una serie de socios en los seminarios de aprendizaje federales conjuntas, como la parte superior internacional IJCAI y NeruIPS, interno Computer Society CCFTF, etc., para atraer a más investigadores a unirse ; DESTINO comunidad de código abierto ha de absorber gradualmente cientos de aplicaciones e instituciones de construcción; industria de la caída en el sector financiero más control en profundidad en el viento, el campo de aplicación de lavado de dinero han logrado muy buenos resultados.

En los niveles de normalización, se espera que el proyecto de norma internacional IEEE para ser introducido este año, el primer grupo de estudio federal de China en las normas publicadas en junio de 2019, la propuesta federal es también el aprendizaje activo actualmente en las normas nacionales.

Hasta ahora, en 2019, más y más socios a unirse, si se trata de una práctica común para desarrollar DESTINO, o discusión estándar, la investigación teórica, el aprendizaje federal más y más conocimiento de la industria, sino también por los departamentos gubernamentales interesados.

 

Los resultados prácticos

Marco de código abierto

En la práctica, los bancos de micro-pública de código abierto Federal DESTINO plataforma de aprendizaje, el proyecto en enero de 2019 por primera vez en línea, ha lanzado recientemente la versión 1.2 DESTINO, que es una solución Federal longitudinal común neuronal algoritmo de red que va a aprender la profundidad algoritmo se aplica a una dispersión de datos fragmentados.

Federal implementar algoritmo de red neuronal se basa DESTINO 1.2 nuevos módulos de funcionalidad básica: SecretShare protocolo seguro de cómputo multipartidista. Al mismo tiempo, la variable característica del análisis de correlación Federal también módulo dependiente. Entre las áreas de control de riesgos financieros, análisis de correlación magnitud característica es un control de riesgo muy importante modelar pasos.

Según Chen Tianjian revelada, proyectos de investigación y desarrollo de FATE, en general, hay tres direcciones principales:

  • Abierta y los tres marco de aprendizaje profundo Tensorflow, Pytorch, interoperabilidad PaddlePaddle;

  • Seguir aumentando el escenario real comercial, el rendimiento del modelo federal, facilidad de uso y capacidad de gestión;

  • Continuará respondiendo a los nuevos retos de los requisitos de seguridad de datos y cumplimiento.

Micro Focus del Banco DESTINO construir un conjunto de datos basados ​​en la red de cooperación se basan en estudio federal. En esta red hay, cada vez más empresas a encontrar su negocio puede ayudar a las empresas cooperativas, y la cooperación en el cumplimiento de la seguridad de datos. Chen Tianjian dijo que está avanzando una serie de áreas, incluyendo banca, seguros, aplicaciones de volumen menor de aterrizaje.

 

normas dirigidos

normas técnicas internacionales proporcionarán un lenguaje común de tecnología de la comunicación para la industria, sin importar su propia arquitectura técnica y las herramientas técnicas bajo un estándar unificado, que pueden trabajar mejor juntos, que para el estudio federal sí hizo hincapié en que el mecanismo de "federal" cooperación es especialmente importante paradigma tecnológico.

Para la Federal aprender esta nueva tecnología, la tecnología marcará la introducción de normas de desarrollo tecnológico a una dirección más madura más general, sentar las bases de la comunidad para construir un ecológica federal, mientras que proporciona la base técnica de la legislación y regulación. Lo ideal sería que los mismos sistemas de aprendizaje de diferentes proveedores de desarrollo basada en estándares técnicos federal pueden trabajar juntos, al igual que el mismo equipo de red.

Como iniciador del país, "Federal aprendizaje" la tecnología, los bancos de micro-públicas que siga promoviendo la estandarización de los trabajos de construcción del estudio federal. Chen Tianjian dijo que en base a las discusiones de aprendizaje estándares federales Grupo de Trabajo ha celebrado cuatro reuniones, la norma de contenido general contiene las definiciones marco de aprendizaje federales, así como a B (final del negocio), a C (cliente) y A G en (final del gobierno ) bajo diferentes escenarios de clasificación de escena, la evaluación de seguridad de contenido, y otro estudio federal.

Desde el período de tiempo es, IEEE PROYECTO Se espera que los estándares de aprendizaje federales para ser introducido en la primera mitad de este año, se espera que el lanzamiento oficial de la norma en el segundo tiempo más rápido.

 

recomendaciones prácticas de negocio financiero

A partir de una tecnología verdaderamente se convierten en sistemas críticos y soluciones de productos, bancos de micro-públicas en el proceso también se encontró con muchos retos, tales como el proceso de modelado de una sola parada federal; fácil de entender y máquina de cifrado algoritmos distribuidos bajo escena WAN aprendizaje fácil de mantener, a través del sitio de seguridad en la transmisión de datos y capacidad de gestión, cómo hacer parte interactiva puede ser manejada y auditado y así sucesivamente.

Por el mismo deseo de desplegar estudio federal de las empresas financieras, Chen Tianjian experiencia práctica micro-públicas bancos dan algunas sugerencias. Dijo que, en primer lugar, las empresas financieras tienen que darse cuenta de que la regulación de datos aprieta es un tema de tendencia, es necesario en el desarrollo de una estrategia de datos para el desarrollo a largo plazo se basa en la tecnología de aprendizaje federal como una parte importante del desarrollo de estrategias de datos.

En segundo lugar, se trata de grandes conjuntos de datos de los más frecuentes en sectores como la Dirección de Riesgos, encabezados por la necesidad de verificar la aplicación del aprendizaje federal y mejora, con una aplicación de demostración para el avance, y luego se extendió a la otra.

Una vez más, tenemos que elegir pareja de datos más fiable y compatible porque todo aprendizaje federal es una tecnología de protección de datos, no protección de datos. Federal premisa de estudio co es asumir que el proceso de cumplimiento de las partes en los datos recogidos son compatibles, debe ser garantizada.

Por último, el nivel técnico para seleccionar abierta, de código abierto, la tecnología puede ser una auditoría de terceros. Por un lado, la tecnología de código abierto para asegurar la continuidad del suministro y, por otro lado, para garantizar la viabilidad de código abierto de auditoría de terceros. Por ejemplo, la Fundación Linux se ha convertido en un proyecto de aprendizaje internacional organizado por el destino Federal sería una mejor opción.

 

huéspedes de la entrevista:

Director General Adjunto Chen Tianjian Micro Focus del Banco del departamento de inteligencia artificial, responsable del banco y la inteligencia federal técnicas de aprendizaje para construir ecológico. Se sirve en Baidu, Thunder, BGI y muchas otras empresas de tecnología, se desempeñó como director del arquitecto Baidu (T10), arquitecto jefe financiero de Baidu, Baidu búsqueda de diseño, recomendación, la arquitectura general de grandes datos de negocios múltiples, financiera y sistemas críticos.

Publicado 27 artículos originales · ganado elogios 4 · Vistas a 20000 +

Supongo que te gusta

Origin blog.csdn.net/weixin_45439861/article/details/104943170
Recomendado
Clasificación