"Guía práctica de DevOps": notas de lectura (1)

Parte 1 Introducción a DevOps

El enfoque de tres pasos para DevOps: flujo, retroalimentación y aprendizaje y experimentación continuos.

  • Principio de Flujo: Acelera el proceso desde el desarrollo, operación y mantenimiento hasta la entrega a los clientes.
  • Principio de retroalimentación: Nos permite construir un sistema de trabajo más seguro y confiable.
  • Principios de aprendizaje y experimentación continuos: crea una cultura de alta confianza y una forma científica de trabajar, y hace que la mejora organizacional y la innovación formen parte del trabajo diario.

movimiento magro

Las prácticas de mapeo del flujo de valor, Kanban y mantenimiento total de la producción se originaron en el Sistema de Producción Toyota en la década de 1980. En 1997, el Lean Enterprise Institute comenzó a estudiar cómo se podrían aplicar los conceptos Lean a otras corrientes de valor, como la industria de servicios y la industria de la salud.

Dos principios fundamentales de Lean incluyen: la creencia de que el tiempo de entrega (el tiempo que lleva convertir las materias primas en productos terminados) es una de las mejores medidas para mejorar la calidad, la satisfacción del cliente y la felicidad de los empleados; y que la entrega de lotes pequeños Las tareas son la clave para acortar el tiempo de entrega y el tiempo de preparación es un factor clave.

Los principios Lean se centran en cómo crear valor para los clientes a través del pensamiento sistémico. El alcance del pensamiento sistémico implica establecer objetivos duraderos, adoptar el pensamiento científico, crear modelos de colaboración de flujo y atracción (en lugar de empuje), abogar por garantizar la calidad desde la fuente y utilizar la humildad. como base Orientación y respeto hacia todas las personas en el proceso.

Manifiesto ágil

El Manifiesto Ágil fue propuesto conjuntamente por 17 grandes expertos en el campo del software en 2001. Esperan utilizar un sistema liviano de valores y principios para optimizar esos procesos de desarrollo de software pesados ​​(como el modelo de desarrollo en cascada tradicional) y metodologías (como el proceso de desarrollo de software unificado).

En el Manifiesto Ágil, un principio importante es " 频繁地交付可工作的软件,交付周期可以是数星期也可以是数月,推荐更短的周期" y enfatiza el uso de pequeños lotes de tareas para lanzamientos incrementales, en lugar de trabajos a gran escala y lanzamientos de procesos en cascada. Al mismo tiempo, enfatizamos el establecimiento de pequeños equipos autoorganizados para que los miembros puedan trabajar felices en un ambiente de alta confianza.

En muchas empresas que han implementado la metodología ágil, la productividad ha mejorado significativamente y la metodología ágil ha ganado un apoyo y reconocimiento cada vez más amplio. Curiosamente, en el proceso de desarrollo de DevOps, varias actividades clave que se describen a continuación se originaron en la comunidad ágil o en conferencias ágiles.

1. Entrega ágil y continua y enfoque de tres pasos

1.1 Flujo de valor manufacturero

Un concepto básico en Lean se llama flujo de valor . “Una serie de actividades de entrega ordenada realizadas por una organización en función de las necesidades del cliente ”, o “una serie de actividades necesarias para diseñar, producir y proporcionar productos o servicios a los clientes. Incluye el flujo materialesyde información

El flujo de valor se puede ver en todas partes del proceso de fabricación, comenzando con la recepción del pedido de un cliente y el envío de materias primas a la fábrica. Para acortar y predecir el tiempo de entrega en el flujo de valor , generalmente es necesario centrarse continuamente en cómo establecer un flujo de trabajo fluido, incluida la reducción del tamaño del lote, la reducción de la cantidad de trabajo en proceso (WIP), evitar la repetición del trabajo, etc. , al mismo tiempo que es necesario garantizar que los productos defectuosos no pasen a centros de trabajo posteriores y optimizar continuamente todo el sistema en función de objetivos globales.

1.2 Flujo de valor tecnológico

“Traducir las ideas de negocio en los procesos necesarios para ofrecer a los clientes servicios valiosos impulsados ​​por la tecnología”

Las entradas al proceso se proporcionan 业务目标, y , comenzando con el departamento 概念de I+D aceptando el trabajo y agregándolo a la lista de trabajo por hacer.创意假设

Todo trabajo solo genera valor si la aplicación o servicio se ejecuta como se espera en un entorno de producción y brinda servicios a los clientes.

1.2.1 Centrarse en el tiempo de entrega de la implementación

El plazo de entrega de la implementación es un subconjunto del flujo de valor.

El flujo de valor comienza cuando los ingenieros (incluido el personal de desarrollo, control de calidad, operaciones de TI y seguridad de la información) realizan un cambio en el sistema de control de versiones y finaliza cuando el cambio se ejecuta exitosamente en el entorno de producción , proporciona valor a los clientes y genera comentarios y comentarios efectivos. información de seguimiento.

  • En la primera etapa, el trabajo incluye principalmente diseño y desarrollo, lo que tiene muchas similitudes con el desarrollo de productos lean: ambos tienen un alto grado de variabilidad e incertidumbre, no sólo requieren creatividad, sino que algunos trabajos pueden no repetirse, lo que hace imposible determinar el tiempo total de procesamiento.
  • En la segunda fase, el trabajo consiste principalmente en pruebas y operaciones, que es similar a la fabricación ajustada. En comparación con la etapa anterior, requiere creatividad y habilidades profesionales, se esfuerza por lograr la previsibilidad y la automatización, minimiza la variabilidad (como tiempos de entrega cortos y predecibles, defectos cercanos a cero) y cumple con los objetivos comerciales.

No recomendamos completar grandes lotes de trabajo en serie en diseño y desarrollo, y luego pasar a las etapas de prueba, operación y mantenimiento (como usar lotes grandes, un proceso de desarrollo basado en el modelo en cascada y trabajar en ramas de características con larga vida). ciclos). ). Por el contrario, el objetivo es adoptar un modelo en el que las pruebas y las operaciones estén sincronizadas con el diseño y el desarrollo, lo que dará como resultado un flujo de valor más rápido y una mayor calidad. Este modelo sincronizado sólo se puede lograr cuando el trabajo se realiza en lotes pequeños y la calidad está integrada en cada parte del flujo de valor.

  1. Definición del tiempo de entrega y el tiempo de procesamiento
    En la comunidad Lean, 前置时间el tiempo de entrega y 处理时间el tiempo de procesamiento (a veces llamados tiempo de contacto o tiempo de tarea) son dos métricas comunes para medir el desempeño del flujo de valor.

    • El plazo de entrega comienza después de que se crea la orden de trabajo y finaliza cuando se completa el trabajo;
    • El tiempo de procesamiento comienza cuando el trabajo se procesa realmente y no incluye el tiempo que el trabajo permanece en la cola.

    Insertar descripción de la imagen aquí

  2. Escenario común: plazo de implementación de meses
    Normalmente, el plazo de implementación puede tardar varios meses. Una vez que el tiempo de implementación se prolonga, casi todas las etapas del flujo de valor requerirán expertos en “llenar huecos” para remediar la situación. A menudo,
    es probable que solo después de que los cambios del equipo de desarrollo se hayan fusionado antes del final del proyecto se descubra que todo el sistema no funciona correctamente en absoluto y, a veces, el código incluso no se puede compilar ni probar. Cada problema puede tardar días o incluso semanas en localizarse y solucionarse, lo que da como resultado una experiencia del cliente extremadamente deficiente.

  3. Nuestro objetivo: un tiempo de entrega de implementación de minutos.
    Podemos lograr este objetivo enviando continuamente pequeños lotes de cambios de código al sistema de control de versiones , realizando pruebas automatizadas y pruebas exploratorias del código, y luego implementándolo en el entorno de producción. De esta manera, podemos mantener un alto grado de confianza en que los cambios de código se ejecutarán correctamente en producción y, al mismo tiempo, identificar y solucionar rápidamente los problemas que puedan surgir.

    Para lograr más fácilmente los objetivos anteriores, también es necesario optimizar el diseño arquitectónico mediante modularidad, alta cohesión y bajo acoplamiento para ayudar a los equipos pequeños a trabajar de forma autónoma. De esta manera, incluso si falla, estará bajo control y no tendrá impacto en la situación general.
    Insertar descripción de la imagen aquí

1.2.2 Preste atención al indicador de retrabajo - %C/A

Además del tiempo de entrega y el tiempo de procesamiento, la tercera métrica clave en el flujo de valor de la tecnología es el tiempo de finalización y el porcentaje preciso del tiempo total invertido ( %C/A). Esta métrica refleja la calidad de la producción en cada paso del flujo de valor.

"Para captar esto %C/A, pregunte a sus clientes intermedios qué porcentaje del tiempo reciben ' trabajo verdaderamente útil ', es decir, pueden concentrarse en realizar un trabajo útil en lugar de tener que corregir mensajes de error, complementar información o aclarar qué debería ser información".

1.3 Método de trabajo de tres pasos: principios básicos de DevOps

método de tres pasos
Insertar descripción de la imagen aquí

  • El primer paso es darse cuenta del rápido flujo de trabajo desde el desarrollo hasta la operación y el mantenimiento de izquierda a derecha.
    Para maximizar la optimización del flujo de trabajo, necesita visualizar el trabajo, reducir el tamaño de los lotes y los intervalos de espera, eliminar los defectos que se transmiten posteriormente a través de la calidad incorporada y optimizar continuamente los objetivos globales.

    Las prácticas relevantes incluyen la construcción, integración, prueba e implementación continuas, la configuración de entornos bajo demanda, la limitación del número de WIP y la creación de sistemas y organizaciones que puedan implementar cambios de forma segura.

  • El segundo paso es aplicar un mecanismo de retroalimentación del trabajo rápido y continuo en cada etapa de derecha a izquierda.
    Este método previene la recurrencia de problemas al amplificar el circuito de retroalimentación, acorta el ciclo de detección de problemas y permite una reparación rápida.

    De esta manera controlamos la calidad desde la fuente e incorporamos conocimientos relevantes en el proceso. Esto no sólo crea un sistema de trabajo más seguro, sino que también permite detectar y resolver incidentes catastróficos antes de que ocurran.

  • El tercer paso es establecer una cultura corporativa creativa y de alta credibilidad que respalde experimentos dinámicos, rigurosos y científicos.
    Al asumir riesgos de manera proactiva, puede aprender no sólo del éxito sino también del fracaso.

    Al acortar y amplificar continuamente los ciclos de retroalimentación, no solo crea sistemas de trabajo más seguros, sino que también asume más riesgos y realiza experimentos que lo ayudarán a mejorar más rápido que sus competidores y vencerlos en el mercado.

Como parte del tercer paso, podemos hacer que el sistema operativo haga más con menos, convirtiendo la optimización local en optimización global. Además, no importa quién esté involucrado en el trabajo, toda la experiencia se puede acumular continuamente y las personas de la organización pueden aprender de la experiencia y la sabiduría de los demás.

2. Paso uno: principio de flujo

En el flujo de valor de la tecnología, el trabajo normalmente fluye desde los desarrolladores hacia las operaciones, es decir, todas las funciones entre la empresa y los clientes.

El primer paso del método de trabajo que se describirá en este capítulo es establecer un flujo de trabajo rápido y fluido desde el desarrollo hasta la operación y el mantenimiento que pueda ofrecer valor a los clientes. Es necesario optimizar para este objetivo global, en lugar de centrarse en una serie de objetivos locales, como la finalización del desarrollo funcional, la tasa de descubrimiento y corrección de problemas en las pruebas, la disponibilidad de operación y mantenimiento, etc.

Flujo mejorado a través de una mayor visibilidad continua del contenido del trabajo, tamaños de lote e intervalos de espera reducidos y calidad integrada para evitar que los defectos se transmitan posteriormente. Al acelerar el flujo de flujos de valor tecnológico, podemos acortar el tiempo de entrega para satisfacer las necesidades de los clientes internos y externos, mejorar aún más la calidad de nuestro trabajo y hacernos más ágiles y mejores que nuestros competidores.

Nuestro objetivo es mejorar la calidad y confiabilidad de nuestros servicios y al mismo tiempo acortar el tiempo que lleva que el código entre en producción. De hecho, podemos encontrar pistas sobre las aplicaciones de los flujos de valor en la industria manufacturera que nos ayudan a aplicar principios lean a los flujos de valor de la tecnología.

2.1 Hacer visible el trabajo

  • El contenido del trabajo en la industria de la tecnología es invisible, lo que supone una diferencia significativa en comparación con el flujo de valor de la fabricación.
  • El flujo de trabajo técnico se puede lograr con un solo clic del mouse, como reasignar una orden de trabajo a otro equipo. Debido a que la operación de clic es demasiado fácil, diferentes equipos pueden "dejar de trabajar" debido a información incompleta, y los problemas existentes también se transmitirán a los procesos posteriores, y estos problemas son completamente indetectables hasta que no pueden cumplir con el plazo. , o la aplicación falla en producción.

Para poder identificar dónde fluye el trabajo, dónde está en cola o estancado, es necesario visualizarlo lo más posible . 可视化工作板Es una mejor forma de trabajar, como usar tarjetas de papel o electrónicas para mostrar diversas tareas en un tablero Kanban o en un tablero de planificación Sprint.
Insertar descripción de la imagen aquí

Idealmente, un tablero Kanban debería cubrir todo el flujo de valor; el trabajo solo se completa cuando llega al extremo derecho del tablero Kanban. Completar el desarrollo de una determinada función no se puede considerar "completado", solo se puede considerar "completado" cuando la aplicación se ejecuta con éxito en el entorno de producción y comienza a proporcionar valor a los clientes.

Al poner todo el trabajo de cada centro de trabajo en una cola y mostrarlo visualmente, es más fácil para las partes interesadas priorizar cada trabajo en función del objetivo general. De esta manera, cada centro de trabajo puede adoptar un método de procesamiento de tarea única, comenzando con la tarea de mayor prioridad y completando todo el trabajo para aumentar el rendimiento del centro de trabajo.

2.2 Limitar la cantidad de productos

El trabajo técnico suele ser dinámico, especialmente cuando existen servicios compartidos y los equipos deben satisfacer las necesidades de muchas partes interesadas simultáneamente, lo que lleva a acuerdos ad hoc que controlan el trabajo diario .

Los trabajadores del sector tecnológico son fácilmente interrumpidos porque las consecuencias de esta disrupción parecen invisibles para todos, incluso si impactan la productividad más que en la manufactura. Por ejemplo, si a un ingeniero se le asignan varios proyectos al mismo tiempo, tendrá que alternar entre múltiples tareas, reglas cognitivas y objetivos, y pagar el costo de volver a asumir el rol.

Al utilizar tableros Kanban para gestionar el trabajo, puede limitar la realización de múltiples tareas. Al limitar la cantidad de artefactos, también puede identificar más fácilmente los obstáculos en su trabajo.

2.3 Reducir el tamaño del lote

En Lean, una lección importante es que para reducir los tiempos de entrega y mejorar la calidad de la entrega, se deben buscar lotes pequeños continuamente . Teóricamente, el tamaño mínimo de lote es 单件流aquel en el que sólo se procesa una unidad de producto por operación.

"Caso clásico de envío simulado de folletos"
Este ejemplo supone que se van a enviar 10 folletos. Antes de enviarlos, cada folleto debe pasar por 4 pasos: doblar, insertar sobres, sellar sobres y estampar.

Si utilizamos una estrategia de gran volumen (es decir, "producción en masa"), realizaremos los 4 pasos anteriores en secuencia para cada folleto. En otras palabras, primero doble las 10 hojas de papel, luego inserte cada hoja de papel en un sobre, luego selle todos los sobres y finalmente séllelos todos.

Una estrategia de lotes bajos (es decir, "flujo de una sola pieza") en la que todos los pasos requeridos se realizan secuencialmente para cada folleto antes de comenzar con el siguiente folleto. En otras palabras, doblas una hoja de papel, la insertas en un sobre, cierras el sobre y lo sellas; luego, retiras una hoja de papel y repites el proceso.

La diferencia entre adoptar una estrategia de alto volumen y de bajo volumen es enorme. Supongamos que se deben seguir los 4 pasos anteriores para los 10 sobres y que cada paso toma 10 segundos. Si utiliza una política de lote grande de 5, se necesitan 310 segundos para completar el primer sobre sellado.
Insertar descripción de la imagen aquí

Para empeorar las cosas, supongamos que encontramos que el primer paso de plegado es incorrecto durante la operación de sellado del sobre (suponiendo que solo se puede descubrir al sellar), en este caso, el primer momento en que podemos encontrar el error es después de 200 segundos. luego tendríamos que volver a doblar y volver a colocar los 10 folletos de este lote en los sobres.
Por el contrario, cuando se utiliza la estrategia de lotes pequeños, solo se necesitan 40 segundos para completar la producción de la primera carta estampada, que es 8 veces más rápido que la estrategia de lotes grandes. Si se equivoca en el primer paso, simplemente vuelva a trabajar en un folleto. Los lotes más pequeños producen menos trabajo en progreso, los plazos de entrega son más cortos, los errores se detectan más rápido y se reduce el retrabajo.

2.4 Reducir el número de traspasos

En el flujo de valor de la tecnología, si los plazos de implementación se miden en meses, a menudo es porque implementar código desde un sistema de control de versiones hasta producción requiere cientos o incluso miles de operaciones. De hecho, en el proceso de flujo de valor del código, se requiere la colaboración de varios departamentos para completar tareas relacionadas, incluidas pruebas funcionales, pruebas de integración, configuración del entorno, configuración del servidor, gestión de almacenamiento, red, equipos de equilibrio de carga, refuerzo de seguridad de la información, etc. .

Cuando un trabajo se transfiere entre equipos, se requiere mucha comunicación: solicitar, delegar, notificar, coordinar y, a menudo, priorizar, programar, eliminar conflictos, probar y validar.

Para reducir estos problemas, trabaje para reducir la cantidad de traspasos, automatice la mayoría de las operaciones o reestructure la organización para que los equipos puedan entregar valor a los clientes de forma independiente sin depender de otros. Por tanto, aumentar la liquidez reduciendo el tiempo de espera en las colas y el tiempo dedicado a trabajos sin valor añadido.

2.5 Identificar y mejorar continuamente los puntos de restricción

Para acortar el tiempo de entrega y mejorar el rendimiento, necesitamos identificar continuamente puntos de restricción en el sistema y mejorar la productividad del trabajo.

"En cualquier flujo de valor, siempre hay una dirección de flujo y un punto de restricción. Cualquier optimización que no esté dirigida a este punto de restricción es una ilusión".

  • Si optimizamos el centro de trabajo antes del punto de restricción, entonces el trabajo se retrasará más rápido en este punto de restricción.
  • Por el contrario, si se optimiza el centro de trabajo después del punto de restricción, también estará en un estado hambriento, esperando el final del trabajo en el punto de restricción.

solución:

  • Identificar los puntos de restricción del sistema;
  • Decida cómo explotar este punto de restricción del sistema;
  • Con base en las decisiones anteriores, considere la situación general;
  • Mejorar las restricciones del sistema;
  • Si se ha excedido el punto de restricción, regrese al primer paso, pero evite las restricciones del sistema causadas por la inercia.

Durante el proceso de transformación de DevOps, si desea acortar el tiempo de entrega de meses o trimestres a minutos, generalmente necesita optimizar los siguientes puntos de restricción en secuencia.

  • Configuración del entorno
    Si la configuración de un entorno de producción o prueba siempre lleva semanas o meses, la implementación bajo demanda no es posible. La solución es establecer un entorno totalmente de autoservicio bajo demanda para garantizar que el equipo pueda crear automáticamente el entorno cuando lo necesite.
  • Implementación de código
    Si el código tarda semanas o más en implementarse (por ejemplo, cada implementación requiere 1300 operaciones manuales propensas a errores e involucra hasta 300 ingenieros), entonces no se puede implementar bajo demanda. La solución es automatizar el proceso de implementación tanto como sea posible para que cualquier desarrollador pueda automatizar la implementación bajo demanda .
  • Preparación y ejecución de pruebas
    Si cada implementación de código tarda dos semanas en preparar el entorno de prueba y configurar el conjunto de datos, y se necesitan otras cuatro semanas para realizar manualmente todas las pruebas de regresión, entonces la implementación bajo demanda no es posible. La solución es automatizar las pruebas para que la velocidad de las pruebas pueda mantenerse al día con la velocidad del desarrollo del código mientras se implementa de forma segura y en paralelo.
  • Arquitectura estrechamente acoplada
    Si la arquitectura está estrechamente acoplada, la implementación bajo demanda no es posible porque cada vez que se realiza un cambio de código, el ingeniero debe obtener permiso de la junta de revisión de cambios para implementar el cambio. La solución es crear arquitecturas ligeramente acopladas para que los desarrolladores puedan realizar cambios de forma segura y autónoma, aumentando la productividad.

2.6 Eliminar dilemas y desperdicios en el flujo de valor

Una definición común de desperdicio en Lean es " el acto de utilizar materiales o recursos que exceden lo que el cliente necesita y lo que está dispuesto a pagar ".

El desperdicio y la angustia son los principales factores que causan retrasos en la entrega en el proceso de desarrollo de software. Algunos tipos:

  • Trabajo en progreso: se refiere a cualquier trabajo en el flujo de valor que aún no se ha completado por completo (por ejemplo, documentos de requisitos u órdenes de cambio que aún no se han revisado) o trabajo en cola (como órdenes de trabajo en espera de Revisión de control de calidad o revisión del administrador del servidor). El trabajo parcialmente completado caduca gradualmente y eventualmente pierde valor con el tiempo.
  • Trabajo extra: trabajo extra realizado durante el proceso de entrega que no agrega valor al cliente. Esto puede incluir documentos que nunca se utilizan en centros de trabajo posteriores, o revisiones o aprobaciones de resultados de producción que no agregan valor. Los procesos adicionales no sólo aumentan la carga de trabajo del procesamiento, sino que también aumentan el tiempo de entrega.
  • Extras: aquellas características integradas en el proceso de entrega que simplemente no son requeridas por la organización o el cliente (por ejemplo, "doradas"). La funcionalidad adicional aumenta la complejidad y el esfuerzo de las pruebas y la gestión funcionales.
  • Cambio de tareas: cuando las personas son asignadas a múltiples proyectos y flujos de valor, necesitan cambiar de contexto y gestionar las dependencias entre trabajos, lo que consume trabajo y tiempo adicionales en el flujo de valor.
  • Espera: La espera entre trabajos debido a la competencia por los recursos aumenta el tiempo del ciclo y retrasa la entrega de valor a los clientes.
  • Movimiento: La cantidad de trabajo que mueve información o datos entre centros de trabajo. Por ejemplo, en un proyecto que requiere comunicación frecuente, los miembros del equipo en realidad no trabajan juntos y no pueden sentarse juntos para colaborar estrechamente, en este momento se produce un desperdicio de movimiento de personal. Además, los traspasos de trabajo también pueden generar un desperdicio de movimiento, lo que requiere comunicación adicional para aclarar cualquier parte ambigua.
  • Defecto: Un error, falta de integridad o ambigüedad en la información, materiales o productos que requiere cierto esfuerzo para confirmarlo. Cuanto mayor sea el tiempo entre la aparición de un defecto y su detección, más difícil será resolver el problema.
  • Trabajo manual o no estándar: trabajo manual o no estándar que requiere depender de otros, como el uso de servidores, entornos de prueba y configuraciones que no se pueden automatizar ni reconstruir repetidamente. Idealmente, todo lo que dependa de que los equipos de operaciones lo hagan manualmente debería configurarse para que sea automatizado, bajo demanda o de autoservicio.
  • Pit-filler: Para lograr los objetivos de la organización, algunas personas y equipos tienen que ser puestos en situaciones irrazonables, que incluso pueden convertirse en su rutina diaria (por ejemplo, ocurre un accidente en el entorno de producción a las dos de la tarde). en mitad de la noche y cientos de versiones de software se envían durante la noche.

Nuestro objetivo es visualizar estos desperdicios y dilemas (en cualquier lugar donde se necesite llenar un vacío) y realizar mejoras sistemáticas para reducir o eliminar estas cargas para lograr el objetivo de un flujo rápido.

2.7 Resumen

Mejorar la fluidez de los flujos de valor tecnológico es fundamental para implementar DevOps. Para hacer esto, necesitamos visualizar el trabajo, limitar el trabajo en progreso, reducir el tamaño de los lotes, reducir el número de entregas, identificar y mejorar continuamente los puntos de restricción y eliminar los dilemas laborales diarios.

3. Paso dos: principio de retroalimentación

El método de trabajo del primer paso describe el principio (el principio de flujo) que permite que el trabajo fluya rápidamente de izquierda a derecha en el flujo de valor.
Los principios descritos en el método de trabajo del segundo paso (principio de retroalimentación) permiten obtener una retroalimentación del trabajo rápida y continua en cada etapa de derecha a izquierda.
Nuestro objetivo es crear sistemas de trabajo seguros y fiables.

3.1 Trabajar de forma segura en sistemas complejos

Una característica importante de los sistemas complejos es la incapacidad de ver el sistema como un todo y comprender cómo encajan las distintas partes. Los componentes de los sistemas complejos suelen estar estrechamente acoplados y relacionados, por lo que el comportamiento del sistema no puede explicarse únicamente basándose en el comportamiento de los componentes.

Los fallos en sistemas complejos existen y son inevitables. Por lo tanto, ya sea en la fabricación o en la tecnología de la información, debemos diseñar un sistema de trabajo seguro que permita a los empleados realizar su trabajo sin miedo y garantice que se eviten lo antes posible consecuencias catastróficas como lesiones personales, defectos del producto o impacto negativo en el cliente. Los errores se pueden detectar rápidamente antes de que ocurran.

Es posible que no podamos diseñar un sistema absolutamente seguro, pero podemos hacer que los sistemas complejos funcionen de manera más segura tomando las siguientes cuatro medidas:

  • Gestionar trabajos complejos para identificar problemas operativos y de diseño;
  • Trabajar juntos para resolver problemas y desarrollar rápidamente nuevos conocimientos;
  • Aplicar nuevos conocimientos regionales al contexto global en toda la organización;
  • Los líderes deben seguir cultivando personas con los talentos antes mencionados.

3.2 Encuentra problemas a tiempo

En un sistema de trabajo seguro, validamos continuamente diseños y supuestos . El objetivo es aumentar el flujo de información del sistema antes, más rápido, al menor coste posible, desde tantas dimensiones como sea posible, y determinar las causas y consecuencias del problema con la mayor claridad posible. Cuantas más suposiciones podamos descartar, más rápido podremos identificar y resolver problemas, aumentando nuestra resiliencia, agilidad y capacidad para aprender e innovar.

Hacemos esto incorporando el sistema de trabajo 反馈y前馈回路

En las operaciones de fabricación de alto rendimiento, existe un flujo de información rápido, frecuente y de alta calidad a lo largo de todo el flujo de valor: cada operación de proceso se mide y monitorea, y cualquier defecto o desviación grave se puede descubrir y solucionar rápidamente. Éstos son la base para garantizar la calidad, la seguridad y el aprendizaje y mejora continua.

Nuestro objetivo debe ser establecer ciclos rápidos de retroalimentación y avance a medida que todo el trabajo se realiza en cada etapa del flujo de valor de la tecnología, incluida la gestión de productos, el desarrollo, el control de calidad, la seguridad de la información y las operaciones. Esto incluye la creación de procesos automatizados de compilación, integración y prueba para detectar cambios en el código lo antes posible que puedan provocar defectos.

También necesitamos establecer un sistema de monitoreo integral para monitorear el estado de ejecución de los componentes del servicio en el entorno de producción para detectar rápidamente situaciones de servicio inesperadas. El sistema de seguimiento también puede ayudarnos a medir si nos desviamos de los objetivos esperados e irradiar los resultados del seguimiento a todo el flujo de valor, de modo que podamos ver cómo nuestras acciones afectan a otras partes del sistema.

3.3 Trabajar juntos para superar problemas y adquirir nuevos conocimientos.

Es evidente que no basta con detectar simplemente la ocurrencia de un accidente. Una vez que ocurre un problema, debemos trabajar juntos y movilizar a todo el personal relevante para resolver el problema.

Hacerlo brinda a todos los involucrados una comprensión más profunda de cómo administrar el sistema, convirtiendo las inevitables primeras etapas de ignorancia en un proceso de aprendizaje.

Las razones del trabajo en equipo son las siguientes:

  • Evite que los problemas lleguen a los enlaces de procesamiento posteriores; de lo contrario, no solo el costo y la carga de trabajo de las reparaciones aumentarán exponencialmente, sino que también incurrirá en deuda técnica;
  • Evitar que los centros de trabajo inicien nuevos trabajos, lo que podría introducir nuevos errores en el sistema;
  • Si el problema no se resuelve, el centro de trabajo puede encontrarse con el mismo problema durante la siguiente operación, requiriendo mayores costos de reparación.

3.4 Garantizar la calidad en origen

Ejemplos de control de calidad ineficaz incluyen:

  • Se requieren otros equipos para ayudar a completar una serie de tareas manuales, tediosas y propensas a errores que el propio solicitante debería automatizar.
  • Exigir la aprobación de personas que están lejos del lugar de trabajo real y ocupadas con deberes oficiales, obligándolas a tomar decisiones sin comprender la situación laboral y el impacto potencial, o con solo un sello de aprobación rutinario.
  • Escribir grandes cantidades de documentación que contiene detalles cuestionables y queda obsoleta poco después de ser escrita.
  • Envíe una gran cantidad de trabajo al equipo de operación y mantenimiento y a los miembros del comité de expertos para su aprobación y procesamiento, y luego espere una respuesta.

En el trabajo diario, necesitamos que todos en el flujo de valor identifiquen y resuelvan problemas en sus áreas de control. De esta manera, el control de calidad, la responsabilidad en materia de seguridad y la toma de decisiones pueden ubicarse en el contexto del trabajo que se realiza, en lugar de depender de la aprobación periférica de los altos directivos.

3.5 Optimizado para centros de trabajo posteriores

Lean define que debemos diseñar para dos tipos de clientes: clientes externos (aquellos con más probabilidades de pagar por los servicios que brindamos) y clientes internos (aquellos que nos siguen inmediatamente para recibir y procesar el trabajo). Según los principios Lean, nuestros clientes más importantes son nuestros clientes intermedios. Optimizar nuestro trabajo para ellos requiere que empaticemos con sus problemas para identificar mejor los problemas de diseño que obstaculizan un flujo rápido y fluido.

En el flujo de valor de la tecnología, optimizamos los centros de trabajo posteriores mediante el diseño para las operaciones, incluidos los requisitos no funcionales para las operaciones (como arquitectura, rendimiento, estabilidad, capacidad de prueba, configurabilidad y seguridad) y la funcionalidad del usuario es igualmente importante.

3.6 Resumen

Establecer un mecanismo de retroalimentación rápida es crucial para lograr alta calidad, confiabilidad y seguridad en el flujo de valor de la tecnología. Para hacer esto, necesitamos identificar los problemas cuando ocurren, trabajar juntos para resolverlos y generar nuevos conocimientos, controlar la calidad en la fuente y optimizar continuamente los centros de trabajo posteriores.

4. Paso tres: Principios de experimentación y aprendizaje continuo

El primer paso es establecer un flujo de trabajo de izquierda a derecha (principio de flujo).
El segundo paso es establecer una retroalimentación rápida y continua de derecha a izquierda (principio de retroalimentación).
El tercer paso es establecer una cultura de aprendizaje y experimentación continuos ( aprendizaje continuo y principios experimentales)

Aplicando el método de trabajo de tres pasos se pueden mejorar continuamente las habilidades personales, que luego se pueden transformar en un activo para el equipo y la organización.

En el centro del flujo de valor de la tecnología está la construcción de una cultura de alta confianza. Enfatiza que todos aprenden continuamente y deben asumir riesgos en el trabajo diario; mejorar procesos y desarrollar productos a través de métodos científicos, y acumular lecciones de éxitos y fracasos para identificar ideas valiosas y abandonar ideas inútiles. Además, todas las experiencias locales se transformarán rápidamente en mejoras globales, ayudando así a toda la organización a probar y practicar nuevas tecnologías.

Promover y salvaguardar aún más el aprendizaje reservando tiempo para las mejoras diarias. La mejora continua se refuerza ejerciendo presión continua sobre el sistema. En circunstancias controlables, incluso mejoramos la resiliencia simulando o inyectando fallas en el entorno de producción.

4.1 Establecer una organización de aprendizaje y una cultura de seguridad

En el flujo de valor de la tecnología, al esforzarnos por crear sistemas de trabajo seguros, podemos sentar las bases de una cultura vibrante. Cuando ocurren accidentes y fallas, concéntrese en cómo rediseñar el sistema para evitar que se repitan, en lugar de perseguir problemas humanos.

4.2 Institucionalizar las mejoras en el trabajo diario

En el flujo de valor de la tecnología, para prevenir accidentes catastróficos, los equipos están atrapados en la implementación de varias soluciones temporales, pero no hay tiempo para completar esas valiosas tareas. Por lo tanto, las soluciones ad hoc a los problemas a menudo conducen a la acumulación de problemas y deuda técnica.

Mejore su trabajo diario reservando explícitamente tiempo para pagar la deuda técnica, corregir errores, refactorizar y optimizar su código y entorno. Puede reservar un período de tiempo durante cada ciclo de desarrollo o programar un período de bombardeo kaizen, donde los ingenieros pueden formar sus propios equipos para resolver los problemas que les interesen.

Para el flujo de valor de la tecnología, hacer que los sistemas de trabajo sean más seguros también puede ayudar a identificar y abordar riesgos potenciales. Por ejemplo, podríamos comenzar con una investigación post mortem sin culpabilidad de un incidente que afectó el servicio al cliente y, con el tiempo, identificaremos gradualmente otros riesgos potenciales.

4.3 Transformar los hallazgos locales en optimización global

NR es mundialmente famoso por su cumplimiento de procesos estandarizados, y cualquier proceso o desviación operativa requiere la redacción de un informe de fallas para acumular experiencia. Independientemente de la intensidad de la señal de falla o el nivel de riesgo, los diseños de procesos y sistemas se actualizan continuamente en función de estas experiencias.

En el flujo de valor técnico, también deberíamos establecer una base de conocimiento global a través de un mecanismo similar. Por ejemplo, convierta todos los informes de incidentes en una base de conocimientos con capacidad de búsqueda para que los equipos que la necesiten puedan usarla más fácilmente para resolver problemas similares, mientras establece una base de código fuente compartida a nivel organizacional para que todos puedan usarla fácilmente en toda la organización. , bibliotecas y configuración. Estos mecanismos ayudan a transformar la experiencia individual en sabiduría colectiva que sirva a más miembros.

4.4 Inyectar flexibilidad en el trabajo diario

Las organizaciones de alto desempeño logran o logran mejores resultados mejorando las operaciones diarias, introduciendo tensión continuamente para mejorar la productividad e inyectando mayor flexibilidad en el sistema.

A través de la experimentación continua en su trabajo diario, pueden aumentar continuamente la capacidad de producción sin agregar ningún equipo o personal nuevo. Introducir este tipo de mejoras no solo aumenta la productividad sino que también aumenta la resiliencia, ya que las organizaciones siempre están en un estado de tensión y cambio.

En el flujo de valor técnico, acortar el tiempo de implementación, mejorar la cobertura de las pruebas, acortar el tiempo de ejecución de las pruebas e incluso desacoplar la arquitectura cuando sea necesario son prácticas que introducen tensiones similares en el sistema y también pueden mejorar la productividad de los desarrolladores. fiabilidad

4.5 El liderazgo fortalece la cultura del aprendizaje

Los líderes y los trabajadores de primera línea tienen una relación de trabajo complementaria y deben respetarse mutuamente. Esta relación es necesaria porque nadie puede resolver el problema por sí solo: el líder no
realizará personalmente el trabajo de primera línea necesario para resolver el problema y los trabajadores de primera línea no comprenderán el entorno organizacional más amplio ni tendrán las habilidades para hacerlo. fuera de su área de trabajo el poder de cambiar.

Guiados por estos objetivos estratégicos, establecemos objetivos a corto plazo para iteraciones anidadas y luego establecemos condiciones de objetivos a nivel del flujo de valor o del centro de trabajo (como reducir el tiempo de entrega en un 10% en las próximas dos semanas) para lograr estos objetivos. Estas condiciones objetivo forman el marco de un experimento científico: una descripción clara del problema a resolver, las suposiciones hechas sobre la solución, los métodos para probar las suposiciones, la interpretación de los resultados y cómo utilizar la experiencia para proceder. la siguiente iteración.

Los líderes pueden utilizar las siguientes preguntas para ayudar y entrenar a los experimentadores:

  • ¿Qué hiciste en el paso anterior? ¿qué pasó?
  • ¿Que aprendiste de esto?
  • ¿Cuál es la situación actual?
  • ¿Cuál es la siguiente condición objetivo?
  • ¿Cuáles son los obstáculos para su trabajo actual?
  • ¿Que sigue?
  • ¿Cuál es el resultado deseado?
  • ¿Cuándo se puede realizar una revisión?

La forma en que los líderes ayudan a los trabajadores de primera línea a identificar y resolver problemas en su trabajo diario es en realidad el núcleo del Sistema de Producción Toyota, así como el núcleo de las organizaciones que aprenden, las rutinas de mejora y las organizaciones de alta confiabilidad.

En el flujo de valor de la tecnología, este método de experimentación y mejora iterativa no solo nos guía para mejorar los procesos internos, sino que también nos guía para realizar experimentos continuos para garantizar que los productos que construimos puedan aportar valor a los clientes internos y externos.

4.6 Resumen

El principio del tercer paso del método de trabajo de tres pasos logra una organización que aprende, logra un alto nivel de confianza y cooperación interdepartamental entre departamentos funcionales, acepta el hecho de que "las fallas siempre ocurrirán en sistemas complejos" y alienta a hablar sobre cualquier Problemas para establecer un sistema de trabajo seguro. También requiere institucionalizar mejoras en el trabajo diario, transformar los resultados locales en conocimiento que pueda ser utilizado y aprendido por toda la organización en su conjunto, e inyectar tensión constantemente en el trabajo diario.

Si bien cultivar una cultura de aprendizaje y experimentación continuos es un principio del tercer paso, es inseparable de los métodos de trabajo de los pasos uno y dos. En otras palabras, lograr un flujo de trabajo rápido y una retroalimentación rápida y continua requiere el uso de métodos iterativos y experimentales, incluido el establecimiento de condiciones objetivo, la descripción de la solución prevista, el diseño y la realización de experimentos y la evaluación de los resultados.

El resultado de este tercer paso no es sólo un alto desempeño, sino también una mayor resiliencia, satisfacción laboral de los empleados y adaptabilidad organizacional.

Supongo que te gusta

Origin blog.csdn.net/u010230019/article/details/132667347
Recomendado
Clasificación