Sistema de categorías de etiquetas (metodología de diseño de activos de datos orientado al negocio) - Notas de lectura 6

Capítulo 6 Técnicas: Técnicas y cuestiones importantes

1. Especificaciones de la etiqueta

Los datos deben transformarse en etiquetas que puedan resolver problemas comerciales y mejorar la eficiencia empresarial antes de que tengan valor; de lo contrario, se convertirán en una carga de datos. El proceso de convertir datos en etiquetas se denomina "etiquetado". Al etiquetar se deben considerar plenamente dos factores:

  • ¿Existen datos viables y hay naranja coral cruda disponible para procesarla en etiquetas?
  • Si puede reflejar el valor comercial, es decir, si es una necesidad comercial central o si puede innovar escenarios comerciales.

El núcleo del etiquetado es utilizar el pensamiento de datos para comprender, abstraer, refinar escenarios comerciales y resolver problemas comerciales. En el proceso de etiquetado, es necesario tener especificaciones de etiquetado como guía de operación estándar.

1.1 Etiquetado

1.1.1 El directorio raíz apunta al objeto al que pertenece la etiqueta.

Directorio raíz es a menudo un sustantivo o gerundio vago, amplio y simple. En el nivel físico de los datos, a menudo se asigna a la clave principal en una tabla grande y ancha. La información en esta tabla grande y ancha es una descripción detallada y un registro de datos del objeto de clave principal: las columnas de la tabla grande y ancha están asignadas a las etiquetas y las filas de la tabla grande y ancha. El registro corresponde al registro de valor de atributo específico del objeto específico en cada atributo de etiqueta.

1.1.2 Las categorías son clasificaciones de etiquetas.

Las categorías suelen estar formadas por sustantivos. Una categoría y sus etiquetas clasificadas pueden corresponder a una tabla específica a nivel físico de datos. Se pueden asociar varias tablas de datos con la misma clave principal pero diferentes tipos de información para formar una tabla grande y amplia bajo el objeto de clave principal.

1.1.3 Las etiquetas son atributos de objetos, con granularidad hasta el nivel de campo

Las etiquetas generalmente corresponden a un campo en una tabla de datos en una base de datos.

1.1.4 El valor de la etiqueta es el valor específico del atributo del objeto

El valor de la etiqueta generalmente corresponde al valor de un campo en una tabla de datos de la base de datos.

1.2 Metaetiquetas

Las etiquetas de etiquetas se denominan metaetiquetas. Las metaetiquetas son descripciones de atributos de objetos de etiquetas y están diseñadas para utilizar términos comerciales para ayudar a las empresas de front-end a comprender mejor las etiquetas.

1.2.1 El directorio raíz al que pertenece la etiqueta.

El directorio raíz al que pertenece una etiqueta se refiere a qué objeto pertenece la etiqueta.

1.2.2 Categoría a la que pertenece la etiqueta

La categoría de la etiqueta es el directorio de primer nivel, el directorio de segundo nivel, el directorio de tercer nivel, etc. mencionados anteriormente.

1.2.3 Nombre de etiqueta

La denominación de etiquetas debe seguir tres principios principales: evitar malentendidos que infrinjan la privacidad, usar el mismo nombre de etiqueta para la misma etiqueta y usar estructuras de oraciones similares para etiquetas similares. Las especificaciones básicas para la denominación de etiquetas son las siguientes:

(1) Especificación de formato

La misma etiqueta debe agruparse con el mismo nombre de etiqueta y etiquetas similares deben usar la misma estructura de oración.

(2) Especificación del uso de palabras

  • No se recomienda el uso de palabras como "tarjeta de identificación", "trayectoria", "posicionamiento", "seguimiento", "GPS", "hábitos de usuario", "intención" y "menor". Estas palabras son palabras sensibles y pueden atraer fácilmente atención e investigación innecesarias.
  • Para las etiquetas producidas por el modelo de algoritmo, se recomienda agregar la palabra "predicción" antes del nombre de la etiqueta, como "predecir si hay una casa", etc.
  • No se aplican términos discriminatorios, como "palejo" y "hombre mujer".
  • Las etiquetas de preferencias e intenciones del usuario terminan en "preferencia", como "predecir la preferencia de marca", etc.
  • "Hábito" se puede utilizar solo como verbo en las etiquetas de comportamiento y hábito, como "período de tiempo de navegación habitual".

(3) Especificaciones de contenido

  • Los datos relevantes de menores de edad no deben computarse en el contenido de cálculo de datos de la etiqueta.
  • Los datos de las etiquetas deben obtenerse legalmente o tener autorización legal para su uso, y no se debe utilizar información de datos ilegales o grises para procesar etiquetas.

1.2.4 Descripción de la etiqueta

Utilice una o dos oraciones para explicar el nombre de la etiqueta para evitar problemas como ambigüedad, ambigüedad y polisemia en el nombre de la etiqueta debido a palabras demasiado cortas.

1.2.5 Tipos de procesamiento de etiquetas

Las etiquetas se pueden dividir en etiquetas originales, etiquetas estadísticas y etiquetas de algoritmo según los diferentes tipos de procesamiento.

(1) Definición de tres tipos de etiquetas de procesamiento.

  • Etiquetas de clase originales: los campos que existen en la tabla de datos original pueden ser utilizados por el personal comercial después de una simple regularización y convertirse en etiquetas.
  • Etiqueta de estadísticas: los datos sin procesar se procesan a través de ETL, como suma, promedio, expresión regular, operación de regla y otras operaciones de funciones matemáticas simples.
  • Etiquetas de algoritmo: etiquetas de procesamiento profundo calculadas mediante modelos de algoritmo sobre datos originales, como puntuaciones completas, índices de predicción, etc., obtenidos después de operaciones del modelo de algoritmo, como el reconocimiento de patrones y el aprendizaje profundo.

(2) La relación entre los tres tipos de etiquetas de procesamiento y etiquetas de clasificación de atributos

  • Las etiquetas originales suelen ser etiquetas de atributos básicos, como sexo, edad, nombre, número de teléfono móvil, etc. registrados por el miembro. Los atributos básicos describen directamente los atributos, características e información de un determinado tipo de objeto. La tabla de información básica de Wanwang Leizi, en la que los elementos de información importantes se pueden convertir en etiquetas de clase originales mediante una simple limpieza, recorte de datos, etc. utilizado por el personal de la empresa.
  • Las etiquetas estadísticas suelen ser etiquetas de comportamiento, como el monto total de la transacción en el último mes, etc., que a menudo se obtienen mediante el desarrollo ETL de registros de transacciones originales, registros de cobranza y registros de navegación. Dado que hay demasiados registros detallados para los datos de comportamiento, generalmente es necesario resumirlos y desarrollarlos para obtener etiquetas estadísticas para uso del personal empresarial.
El diseño de etiquetas compuestas estadísticas puede consultar la siguiente plantilla de diseño: sobre la base de etiquetas atómicas, agregue información dimensional para describir o expandir un cierto tipo de atributos en detalle, es decir, [escenario] + [modificación espacio-temporal] + [método de cálculo] + [palabras modificables]] y otra información se combinan como modificadores.
R.  [Escenario] a menudo se refiere a una determinada escena de comportamiento, como transacciones de comercio electrónico, transacciones fuera de línea, etc.
B.  [Modificación espacio-temporal] se refiere a las estadísticas de etiquetas atómicas reducidas a una determinada latitud temporal y una determinada dimensión espacial. Las modificaciones horarias incluyen el último día, los últimos 7 días, etc. La modificación espacial incluye diferentes divisiones geográficas o tipos de canales, como la región del este de China, la región de Zhejiang, la región de Hangzhou y terminales móviles.
C.  [Método de cálculo] se refiere a diferentes métodos de cálculo estadístico, los más comunes incluyen suma, promedio, máximo, etc.
D.  [Las palabras modificables] a menudo están estrechamente relacionadas con la escena. Por ejemplo, en la escena de las "transacciones de comercio electrónico", las categorías se dividen en "productos electrónicos", "ropa", etc. Según el tipo de cliente se puede dividir en “clientes VIP”, “clientes nuevos”, etc.
Combinando los factores anteriores, se puede generar una etiqueta de coincidencia estadística, por ejemplo: el monto total de transacciones de productos electrónicos móviles en el último mes.
  • Las etiquetas de algoritmo a menudo corresponden a etiquetas abstractas de alto nivel, como intereses y pasatiempos, pensamiento de personalidad y evaluación de valores. Debido a que no existe una manera sencilla de confirmar y juzgar los valores específicos de estas etiquetas abstractas de alto nivel, es necesario utilizar el modelado algorítmico para realizar un aprendizaje profundo y un juicio inteligente de big data basado en una gran cantidad de información básica y comportamiento. información. Los datos originales utilizan tecnologías de algoritmos como la minería de datos y el aprendizaje automático para predecir y evaluar funciones avanzadas.

(3) La conexión entre los tres tipos de etiquetas de procesamiento y varias etiquetas bajo personas, objetos y relaciones.

  • Las etiquetas de atributos básicos de los objetos "humanos" son a menudo etiquetas primitivas, y las etiquetas de relaciones de comportamiento son a menudo etiquetas estadísticas; las etiquetas de interés, hábito y pensamiento a menudo corresponden a etiquetas de algoritmos.
  • Los atributos básicos, la utilidad funcional y las etiquetas de atributos maestro-esclavo de los objetos "cosa" suelen ser etiquetas primitivas; las etiquetas de comportamiento pasivo son generalmente etiquetas estadísticas; las etiquetas de evaluación de valores suelen ser etiquetas de algoritmo.
  • Las etiquetas de persona de los objetos de "relación" a menudo apuntan a etiquetas de atributos básicos de ID, que son etiquetas primitivas utilizadas para identificar de forma única a personas y objetos relacionados; las etiquetas de preparación de relaciones y proceso de relación a menudo corresponden a etiquetas estadísticas; etiquetas de resultados de relaciones Corresponden a la evaluación del algoritmo etiqueta de clase.

1.2.6 Lógica de etiquetas

La lógica de etiquetas se refiere a la descripción de los métodos de desarrollo de etiquetas, procedimientos de procesamiento, lógica de cálculo, etc.

  • Etiqueta de clase original: la lógica generalmente se expresa como la adopción directa del campo m en la tabla a después de una simple limpieza.
  • Etiquetas estadísticas: la lógica suele ser acumulación histórica/últimos N días/últimos N meses/frecuencia de aparición del último comportamiento XX/hora publicada con frecuencia/ubicación publicada con frecuencia/estadísticas de cantidad/número de veces estadísticas/estadísticas de cantidad, etc.
  • Etiquetas de algoritmo: la lógica generalmente debe estar claramente definida y las características importantes que deben incluirse en el procesamiento del modelo de algoritmo, definiciones de muestras positivas y negativas o aprendizaje de lógica de muestra, selección de modelo y estructura del modelo, forma de resultado de salida del modelo y configuración de segmentación de umbral , modelo deseado Indicadores de desempeño de resultados de predicción, etc.

1.2.7 Etiquetas de valor

Un diccionario de valores es una enumeración de valores posibles para una etiqueta.

1.2.8 Tipo de valor

El tipo de valor es el tipo de datos del valor de etiqueta.

1.2.9 Ejemplo

Proporcione 1 o 2 ejemplos de valores de etiquetas, que se utilizan principalmente para etiquetas numéricas continuas que no se pueden enumerar exhaustivamente o etiquetas con cientos o miles de elementos enumerados, para ayudar a los desarrolladores y al personal comercial a comprender mejor las definiciones de etiquetas.

1.2.10 Ciclo de actualización

El ciclo de actualización generalmente se refiere al ciclo de actualización de datos del indicador.

  • Etiqueta de clase original: el valor de la etiqueta no cambiará, lo que puede alargar el ciclo de actualización;
  • Las etiquetas estadísticas pueden actualizar los datos originales cada 1 día, cada 7 días, cada mes, etc., para diseñar el ciclo de actualización de esta etiqueta;
  • Etiquetas de algoritmo: los modelos de algoritmo a menudo están diseñados para optimizarse de forma iterativa, por lo que se actualizan cada trimestre o medio año. El ciclo de actualización es entre las etiquetas de clase originales y las etiquetas de clase estadísticas.

1.2.11 Nivel de seguridad

Se recomienda construir una clasificación de seguridad de 1 a 4 niveles (L1 a L4):

  • L1: etiqueta pública, que puede divulgarse al público, es la etiqueta de datos más abierta y tiene el nivel de seguridad más bajo;
  • L2: etiqueta interna, que es una etiqueta de datos que se puede hacer circular, solicitar y utilizar directamente en todos los departamentos de una empresa/institución y tiene un nivel de seguridad bajo;
  • L3: Etiquetas de confidencialidad, el uso entre departamentos dentro de la empresa debe solicitar autorización y las etiquetas solo se pueden usar después de la aprobación, con un nivel de seguridad más alto;
  • L4: Etiqueta confidencial, que es una etiqueta que solo pueden utilizar unos pocos talentos dentro de la empresa/institución y no se puede difundir, con el más alto nivel de seguridad.

Cada empresa/institución puede establecer diferentes permisos de aplicación, operación y uso para etiquetas de nivel L1 ~ L4 según sus propias condiciones reales.

1.2.12 Información de almacenamiento físico correspondiente a la etiqueta

Las etiquetas deben asignarse a la tabla física subyacente para poder realizar un flujo de datos real al producir servicios de datos. Registre el nombre de la tabla física y el nombre del campo al que está asignada cada etiqueta para garantizar que cuando la etiqueta necesite encontrar problemas o administrarse y optimizarse más adelante, se pueda ubicar rápidamente la ruta física correspondiente y la lógica de desarrollo real.

1.2.13 Etiqueta responsable

Es necesario registrar una lista de personas responsables de la etiqueta para que el personal comercial que tenga preguntas sobre la etiqueta pueda localizar rápidamente al personal relevante y obtener respuestas rápidamente al rastrear.

1.2.14 Tiempo de finalización

El tiempo de finalización se refiere al momento en que se completa el último desarrollo de confirmación lógica de la etiqueta, o al momento de la versión de la última ejecución de modelado estable de la etiqueta de tipo de algoritmo.

2. Etiquetas combinadas

Las etiquetas combinadas se pueden dividir en dos niveles según la complejidad de la combinación:

2.1 Combinaciones de etiquetas bajo el mismo objeto

Incluyendo el procesamiento de valores de una sola etiqueta y el procesamiento de valores de múltiples etiquetas. Los métodos de procesamiento incluyen el uso de diversas operaciones estadísticas, como expresiones regulares, operadores matemáticos y funciones de datos.

2.2 Combinación de etiquetas entre diferentes objetos

2.2.1 Pasos de diseño de combinación de etiquetas entre objetos

  • Identificar objetos en los requisitos comerciales.
  • Diseñar etiquetas de "objetos" relacionadas con condiciones que involucren múltiples objetos
  • Dividir etiquetas hasta el más mínimo detalle
  • Configure etiquetas base en etiquetas combinadas.

2.2.2 Tres puntos a tener en cuenta al diseñar combinaciones de etiquetas entre objetos

(1) Recuerde siempre que las etiquetas y los resultados de los datos son diferentes

Las etiquetas son activos de datos básicos y reutilizables, y los requisitos de resultados de datos de las empresas en general son en realidad los requisitos de los servicios de datos. Los servicios de datos suelen estar compuestos por etiquetas relacionadas + el proceso de procesamiento de etiquetas.

(2) Es muy importante descubrir las etiquetas de relación de dos objetos.

Las etiquetas de dos objetos deben combinarse en una etiqueta a través de etiquetas asociadas para lograr la extensión de objetos.

(3) El proceso de diseño de etiquetas y el proceso de uso de etiquetas son procesos inversos.

En un escenario de aplicación de datos complejos, el proceso de diseño de la etiqueta se invierte y se desmantela desde los resultados de los requisitos comerciales hasta la etiqueta básica, mientras que el proceso de uso de la etiqueta va desde la operación básica inicial de la etiqueta hasta la salida del resultado de los requisitos comerciales.

3. Cómo utilizar etiquetas

3.1 ¿Qué es la reutilización a nivel de plataforma?

La esencia central del centro de datos es mejorar la reutilización, reducir los costos de prueba y error empresarial y maximizar la iniciativa y el entusiasmo del personal empresarial. Hay cuatro niveles en el nivel de reutilización del sistema:

  • La [reutilización a nivel de código] más básica: descubra las partes reutilizables del código existente, modifíquelas y luego reutilícelas. Este tipo de reutilización es el más superficial y causará problemas como migración de código y errores de uso.
  • El segundo nivel [reutilización a nivel de componente]: el código común que satisface las necesidades de una determinada función se resumirá y encapsulará en un componente, y el uso de este componente es reutilizable. El middleware técnico puede contarse como reutilización a nivel de componente.
  • El tercer nivel [reutilización a nivel de producto]: algunos productos tienen capacidades de uso general y amplia aplicabilidad. Una vez completado el embalaje, se deja una interfaz de adaptador para realizar la reutilización de todo el producto.
  • El nivel más alto [reutilización a nivel de plataforma]: existen varios componentes, productos, etc. en forma de una cadena ecológica. En esta plataforma, los desarrolladores de sistemas pueden elegir los módulos de bloques de construcción requeridos (unidades reutilizables) por bloques de construcción, ensamblados rápidamente. en el sistema técnico final.

3.2 Cómo utilizar etiquetas para la reutilización a nivel de plataforma

3.2.1 Libre elección de etiquetas

Las etiquetas son un concepto en el nivel de activos de datos y son la unidad más pequeña de información de datos. Después de encapsular los datos con etiquetas, solo necesita seleccionar las etiquetas requeridas en el portal de etiquetas/tag mart cada vez para ingresar al proceso de uso y configuración. No es necesario Cada vez, se realizan operaciones como búsqueda de tablas, lectura y escritura de código para recuperar tablas de datos.

3.2.2 Configuración de uso de etiquetas

Los componentes del servicio tienen dos características principales:

  • La herramienta del componente en sí no contiene datos y la tabla de datos de etiquetas debe sincronizarse automáticamente o importarse activamente a estos productos mediante la selección de etiquetas en el primer paso;
  • Se pueden configurar y arrastrar varias operaciones a través de una interfaz visual, básicamente realizando un desarrollo sin código o con código bajo.

A través de los dos pasos anteriores: selección libre de etiquetas y configuración sin código de componentes de servicio, el desarrollo de servicios de datos/sistemas de aplicaciones de datos se puede completar mediante la reutilización a nivel de plataforma. Solo esta forma de utilizar etiquetas puede potenciar el lado comercial: mejorar en gran medida la eficiencia del uso de etiquetas, optimizar completamente la calidad de las etiquetas y establecer una conexión de valor entre el lado de los datos y el lado comercial.

3.3 ¿Qué son los componentes de servicio, los servicios de datos y los sistemas de aplicación de datos?

En el uso de datos a gran escala por parte de las empresas, las etiquetas deben usarse junto con los componentes del servicio para maximizar el valor de los datos y garantizar la estabilidad de los servicios de datos.

3.3.1 Componentes del servicio

Un componente de servicio es una encapsulación diseñada de una determinada función de datos. Generalmente proporciona una interfaz interactiva para implementar operaciones como importar o asociar etiquetas de datos, configurar funciones de servicio, etc. Hay dos métodos de salida:

  • Generar servicios de datos en forma de API, que son adecuados para acoplarse a sistemas complejos o cuando los requisitos de personalización de la interfaz y el sistema son altos;
  • El sistema de aplicación de datos generado tiene directamente una interfaz interactiva simple, que puede ser utilizada directamente por el lado comercial de un extremo a otro, que es simple y clara.

3.3.2 Servicios de datos

El servicio de datos significa que la API de Tonggu proporciona ciertas funciones de datos para satisfacer las necesidades de las llamadas al sistema empresarial.

  • De uso flexible, se pueden combinar múltiples API de servicios de datos en un sistema de aplicación de datos;
  • La pantalla es flexible y la API se puede conectar con varios componentes visuales para satisfacer las necesidades únicas de la interacción del lado empresarial.

3.3.3 Aplicación de datos

La aplicación de datos apunta al lado comercial para proporcionar una combinación de funciones de datos con una interfaz interactiva, que es una presentación sistemática de los resultados de la aplicación de datos.

4. Cómo operar las etiquetas

4.1 Operación del ciclo de vida completo de las etiquetas

4.1.1 Diseño de etiquetas

Los diseñadores de activos de datos llevan a cabo trabajos de diseño de etiquetas basándose en investigaciones comerciales, investigaciones de datos y otros trabajos preliminares, y producen diagramas de arquitectura del sistema de categorías de etiquetas y documentos de diseño de etiquetas, incluidos objetos de etiquetas, sistemas de categorías, nombres de etiquetas, tipos de procesamiento de etiquetas, lógica de etiquetas y valores Información de metaetiqueta como campo, tipo de valor, ejemplo, ciclo de actualización, etc.

4.1.2 Desarrollo de etiquetas

Una vez completado el diseño de la etiqueta, las etiquetas se clasifican según el tipo de procesamiento y luego se envían a los ingenieros de desarrollo de datos y a los ingenieros de algoritmos, quienes desarrollarán varias etiquetas. Las etiquetas originales y estadísticas las completan los ingenieros de desarrollo de datos, y las etiquetas de los algoritmos las completan los ingenieros de algoritmos. Una vez completado el desarrollo de la etiqueta, el ingeniero de desarrollo de datos agregará la información de almacenamiento físico de la etiqueta completa, como el nombre de la tabla, el nombre del campo, la persona a cargo, el tiempo de finalización, etc., para completar la asignación de la etiqueta a los datos. capa.

4.1.3 Listado de etiquetas

Una vez desarrollada la etiqueta y agregada la información completa de la metaetiqueta, la etiqueta debe incluirse en el sistema de administración de etiquetas. Una vez colocada la etiqueta en el estante, se puede abrir y mostrar al personal de la empresa en todos los extremos para que la vea, consulte y utilice a través del portal de etiquetas. Durante este proceso, el sistema determinará la visualización de datos y los permisos de aplicación para diferentes cuentas según el nivel de seguridad de la etiqueta, la función del departamento y otra información. Los permisos incluyen el rango de conjuntos de etiquetas visibles, el rango de detalles de etiquetas, el rango de conjuntos de etiquetas aplicables, etc.

4.1.4 Uso de etiquetas

Las etiquetas sólo pueden ser valiosas si las utilizan las empresas. Hay tres formas de utilizar etiquetas:

  • Sincronización de datos: se refiere a la sincronización directa de los datos de las etiquetas procesadas con la base de datos del sistema empresarial, que generalmente solo se utiliza en el negocio principal.
  • Aplicación de datos: se refiere a encapsular la función de etiqueta en un formulario de interacción del producto para uso externo. La habilidad puede rastrear el estado de las llamadas de etiqueta y evaluar el efecto del uso de la etiqueta. Este método está profundamente ligado al lado comercial: dado que el personal comercial tiene diferentes hábitos de uso y muchas necesidades de formulación comercial, los productos generales no pueden satisfacer las necesidades personalizadas de muchas interfaces comerciales y tienen una escalabilidad limitada.
  • Servicio de datos: el método de uso de etiquetas se desarrolla en un formulario API y se conecta al sistema empresarial. El personal empresarial puede utilizar etiquetas de forma flexible sin copiar directamente los datos de las etiquetas, y el estado de la llamada es fácil de rastrear y monitorear. Los servicios de datos son una forma ideal de utilizar etiquetas, que pueden reflejar y poner en juego mejor el gran valor de las etiquetas. Durante el uso de etiquetas, es necesario monitorear su estado de llamada para auditar la estabilidad, la seguridad y el cumplimiento.

4.1.5 Gobernanza de etiquetas

  • Información de parentesco consanguíneo: el camino de producción de etiquetas es el parentesco consanguíneo, que registra la fuente, el proceso de procesamiento y el acoplamiento de la aplicación de cada etiqueta en función de hechos históricos.
  • Especificaciones de metaetiquetas: cada etiqueta debe registrarse con información comercial y técnica de metaetiquetas. La gestión de metaetiquetas debe formar un sistema normativo unificado para realizar el registro de información unificada y la inspección de etiquetas.
  • Gestión de calidad: la gestión de calidad de las etiquetas debe abarcar todo el proceso de las etiquetas, desde el diseño, el uso hasta el archivo. Su núcleo es formular un conjunto de reglas de gestión de instrucciones de etiquetas, seguir los estándares de calidad de las etiquetas y estar equipado con una plataforma visual de monitoreo de calidad de las etiquetas. herramientas de validación cruzada de etiquetas, etc. Soporte Técnico.
  • Gestión de la seguridad: Sistemas de garantía de seguridad con etiqueta "Tres horizontales y tres verticales". Las "tres verticales" se refieren al concepto de seguridad y a la estrategia general: primero, el uso de etiquetas debe cumplir con las políticas y regulaciones nacionales relacionadas con big data; segundo, se debe garantizar la seguridad de todos los activos de datos de todos los clientes; finalmente, durante Se debe evaluar el proceso de uso específico, el registro de sensibilidad de la etiqueta, formular las estrategias de gestión de seguridad correspondientes y los planes de implementación de seguridad. "Tres horizontales" se refieren a la adopción de soluciones centrales: una es un mecanismo de cifrado triple, la otra es un sistema de seguridad de etiquetas invisibles y la tercera es una identificación central generada por todas las identificaciones.

4.1.6 Comercialización de etiquetas

Una vez completado el desarrollo de la etiqueta, es necesario clasificar, publicitar y promover el valor de la etiqueta en el mundo exterior, de modo que el personal del departamento comercial pueda conocer la información diversa de la etiqueta lo antes posible.

Las empresas deben centrarse en la realización del valor de las etiquetas y operar continuamente durante todo el ciclo de vida de las etiquetas. A través de la optimización de la gestión de etiquetas inversa y basada en el valor, el rendimiento del uso de las etiquetas es estable, las etiquetas se comparten en los estantes, se mejora la eficiencia del desarrollo de etiquetas y se crean nuevas etiquetas. Sólo a través de la expansión y otros objetivos de enlace podemos lograr en última instancia un crecimiento sostenido y estable en el valor de los activos de datos.

4.2 Unidades responsables en el proceso de operación de etiquetas

  • En las primeras etapas de una empresa que crea un sistema de categorías de etiquetas y cuando es necesario crear etiquetas unificadas a nivel empresarial, se recomienda que el departamento de datos unifique el diseño, desarrollo, gestión y operación de las etiquetas.
  • Una vez que cada departamento comercial haya formado una cierta profundidad de pensamiento de datos y haya dominado el método de construcción de etiquetas, la autoridad del diseño y desarrollo de etiquetas se puede abrir al departamento comercial, es decir, al equipo de datos del departamento comercial.
  • Una vez desarrolladas las etiquetas diseñadas por cada extremo comercial, se pueden colocar en los estantes como etiquetas privadas, que solo son utilizadas por sus propios departamentos comerciales.
  • El departamento de datos empresariales y cada departamento comercial pueden establecer el grado de apertura de sus propias etiquetas: el nivel 01 está abierto al público y no requiere revisión por parte del departamento cuando lo utilizan otros departamentos; el nivel 02 está abierto al público pero requiere revisión por el departamento cuando lo utilizan otros departamentos; el nivel 03 El nivel 04 es específico y abierto, y no requiere revisión por parte de este departamento cuando lo usan los departamentos específicos; el nivel 04 es específico y abierto, pero no requiere revisión por parte de este departamento cuando utilizado por los departamentos específicos.
  • El equipo de operación de la etiqueta debe revisar si la denominación de la etiqueta está estandarizada, si la etiqueta es adecuada para su divulgación pública, si la información de la etiqueta está completa, etc.; juzgar la calidad de la etiqueta a través de un fondo de monitoreo unificado o un mecanismo de retroalimentación, y tomar decisiones sobre la gobernanza. optimización, adoptar métodos operativos y estar orientado al valor, lograr el desarrollo estable de todo el ciclo de vida de la etiqueta y formar un ecosistema operativo con una fuerte participación empresarial.

4.3 Bucle cerrado de operación de etiqueta

  • El primer anillo es el anillo de diseño, que incluye el desarrollo del diseño y el lanzamiento de la etiqueta. En este enlace, los diseñadores de activos de datos no solo desarrollan etiquetas para quién se necesita en el escenario empresarial actual, sino que también diseñan etiquetas de manera deliberada y prospectiva para posibles escenarios futuros.
  • El segundo timbre es el timbre de uso, que incluye la selección de etiquetas, la aplicación y las llamadas. En todo el proceso, el personal de la empresa puede seleccionar de forma centralizada la etiqueta adecuada y solicitar su uso mediante la apertura de la etiqueta diseñada y desarrollada en la primera etapa, y al mismo tiempo ayudar al personal de la empresa a agregar la etiqueta requerida de acuerdo con la situación real. demanda.
  • El tercer enlace es el enlace de administración, que incluye el registro de información básica de etiquetas, evaluación del uso, optimización de etiquetas para mejorar los efectos de uso, etc.

5. ¿Cómo comprobar la calidad de la etiqueta?

La calidad de las etiquetas se puede evaluar desde tres dimensiones principales: fuente de datos, proceso de procesamiento de etiquetas y proceso de uso de etiquetas.

5.1 Indicadores relacionados con la fuente de datos

  • Seguridad de la fuente de datos: el nivel de seguridad de los datos de la fuente de datos, si se obtienen legalmente y si están autorizados por el usuario afectará indirectamente la seguridad de los datos de la etiqueta.
  • Precisión de la fuente de datos: la precisión de los datos de la fuente de datos, ya sea adquisición en el primer sitio, adquisición indirecta o cálculo de borde, está relacionada con la precisión final de la etiqueta.
  • Estabilidad de la fuente de datos: la estabilidad de la generación de datos de la fuente de datos, incluida la estabilidad del ciclo de generación, la estabilidad del período de generación, la estabilidad de la cantidad de datos generados, la estabilidad del formato de datos generados, la estabilidad de los datos generados. valores, etc
  • Puntualidad de la fuente de datos: el intervalo de tiempo entre los datos de la fuente de datos que se generan en el primer sitio y su transmisión e ingreso. La puntualidad de los datos de comportamiento afectará indirectamente la precisión de la etiqueta.
  • Integralidad de las fuentes de datos: si los datos de la fuente de datos son completos y si los datos de todos los niveles se pueden integrar y abrir para realizar cálculos globales.

5.2 Indicadores relacionados con el proceso de procesamiento de etiquetas

  • Precisión de la prueba de etiquetas: la precisión de las etiquetas obtenidas durante el proceso de modelado y prueba es una precisión inicial similar a la de naturaleza experimental, como referencia.
  • Estabilidad de la producción de etiquetas: la estabilidad del tiempo de cálculo, procesamiento y producción de etiquetas todos los días, y si se pueden producir a tiempo, también es un indicador importante que el personal comercial debe considerar al usar etiquetas.
  • Puntualidad de la generación de etiquetas: el intervalo de tiempo para la generación de etiquetas, cuanto más corto sea el intervalo de tiempo, mayor será la puntualidad. La puntualidad es particularmente importante para las etiquetas en tiempo real.
  • Cobertura de valor de etiqueta: la cantidad de objetos individuales con un valor de etiqueta válido para una determinada etiqueta. El grado de perfección de los datos para cada tema individual es diferente y la misma etiqueta puede cubrir diferentes grupos de temas.
  • Integridad de la etiqueta: las etiquetas tienen mucha información de metaetiquetas, es decir, las "etiquetas" de las etiquetas. La integridad de la información de estas metaetiquetas es un indicador de usabilidad para uso comercial.
  • Normatividad de las etiquetas: la información de metaetiquetas de las etiquetas debe registrarse en un formato estandarizado, incluido si la información de metadatos de las etiquetas existentes es compatible y en qué medida.
  • Dispersión del valor de la etiqueta: si los valores de la etiqueta se concentran en un determinado rango de valores o en una determinada cantidad de valores, o si se distribuyen según credenciales relativas. El grado de dispersión no es absolutamente bueno o malo, en general, cuanto mayor sea el grado de dispersión, mejor, lo que indica que se pueden encontrar varios grupos con diferentes valores propios.

5.3 Indicadores relacionados con el proceso de uso de etiquetas

  • Precisión del uso de etiquetas: durante el proceso de uso de etiquetas, la precisión de las etiquetas obtenida a través de la verificación y los comentarios del escenario empresarial es un juicio de precisión más realista.
  • Volumen de llamadas de etiqueta: se puede hacer referencia al volumen de llamadas diario promedio de la etiqueta, al volumen de llamadas acumulativo actual de hoy, al volumen de llamadas acumulado histórico y al pico de volumen de llamadas histórico, lo que refleja la cantidad de veces que la empresa ha llamado a la etiqueta.
  • Popularidad de la audiencia de la etiqueta: cuántos departamentos comerciales, escenarios comerciales y personal comercial solicitan la etiqueta, lo que puede reflejar la aplicabilidad y capacidad de generalización de la etiqueta.
  • Tasa de éxito de llamadas de etiqueta: en el escenario de uso real de una determinada etiqueta, la relación entre el número de llamadas exitosas (número total de llamadas históricas - número de llamadas fallidas) y el número total de llamadas.
  • Tasa de falla de etiqueta: la proporción del tiempo de falla acumulado con respecto al tiempo total de servicio de una etiqueta en escenarios de uso reales.
  • Popularidad de atención de etiquetas: la popularidad calculada calculando exhaustivamente la popularidad de las etiquetas en portales de etiquetas como búsquedas, navegación, colecciones, consultas, discusiones, etc.
  • Grado de optimización continua de la etiqueta: si los desarrolladores continúan optimizando la etiqueta de forma iterativa o si aún se encuentra en la etapa de desarrollo principal, refleja el grado en que la etiqueta se ha refinado y optimizado repetidamente.
  • Uso continuo de etiquetas: una vez que la etiqueta se aplica para su uso por parte de la empresa, la duración promedio de las llamadas, la frecuencia y el estado de la promoción reflejan si la etiqueta realmente aporta valor a la empresa.
  • Relación costo/rendimiento de la etiqueta: cálculo integral del costo de la fuente de datos, el costo de computación y el costo de almacenamiento generados durante el proceso de procesamiento de etiquetas y el valor que aporta al negocio, el volumen de llamadas, la importancia de la aplicación, etc., y el costo/rendimiento resultante. El índice es una vista integral del costo y el parámetro de valor del equilibrio.

6. ¿Cómo mirar los costos de las etiquetas?

6.1 Costos de almacenamiento y recopilación de fuentes de datos de etiquetas

6.1.1 Construcción de información

Como resultado de la construcción de la informatización, el costo de almacenamiento de los datos fuente necesarios para el desarrollo de etiquetas es una de las fuentes de los costos de recolección y almacenamiento de etiquetas.

6.1.2 Puntos de enterramiento de datos

El enterramiento de datos es una forma de obtener datos del sistema en línea. Hay mucha información de bajo valor en los datos de registro obtenidos mediante el enterramiento de datos, por lo que es necesario utilizar tecnología de algoritmos para modelar y extraer estos datos de comportamiento para descubrir los datos verdaderamente valiosos. El costo de inversión técnica del enterramiento de datos según las necesidades de las etiquetas y el costo de almacenamiento de los datos enterrados son dos fuentes de costos de recolección y almacenamiento de etiquetas.

6.1.3 Registro complementario de datos

Para cierta información de datos fuera de línea fuera del sistema de información central, se puede complementar no registrando el sistema o complementando la información en el sistema existente. El costo de inversión técnica del registro de datos suplementarios según las necesidades de las etiquetas y el costo de almacenamiento de datos suplementarios son tres fuentes de costos de recolección y almacenamiento de etiquetas.

6.1.4 Rastreador de datos

A través de la tecnología de rastreo, las empresas pueden rastrear información más allá de sus propias operaciones, negocios y conocimientos, y aprovechar al máximo la sabiduría pública. La inversión técnica en el rastreo de datos en función de las necesidades de etiquetas y el costo del almacenamiento de datos del rastreador son cuatro fuentes de costos de recolección y almacenamiento de etiquetas.

6.1.5 Adquisición de datos

El costo de capital de la adquisición de datos basado en las necesidades de etiquetas y el costo de almacenamiento de los datos adquiridos son las cinco fuentes de costos de recolección y almacenamiento de etiquetas.

6.1.6 Cooperación en materia de datos

Los datos compartidos suelen ser datos de resultados estadísticos. Las empresas no pueden obtener registros de datos detallados y sólo pueden utilizarlos como complemento de cierta información. El costo de inversión de la cooperación de datos según las necesidades de etiquetas y el costo de almacenamiento de los datos cooperativos son las seis fuentes de recopilación y almacenamiento de etiquetas.

6.2 Costos de diseño y procesamiento de etiquetas

El enlace de diseño de etiquetas incluye investigación de datos, investigación de escenarios comerciales de la industria, sistema de categorías de etiquetas y diseño de etiquetas específicas, etc. Los costos incurridos en estos procesos son básicamente costos laborales, el enlace de procesamiento de etiquetas incluye sincronización de datos, limpieza de datos, desarrollo de datos y datos. Gobernanza Otros subenlaces incurrirán en costos laborales, costos de inversión técnica y costos de cálculo y almacenamiento de datos.

6.3 Uso de etiquetas y costos de marketing

El costo de usar etiquetas incluye principalmente costos de consumo de recursos informáticos, costos de mano de obra y costos de desarrollo y operación del sistema de información de etiquetas. Entre ellos, una proporción relativamente grande es el costo de los recursos informáticos consumidos en el uso de etiquetas. Los costos informáticos y de almacenamiento de datos consumidos por diferentes motores informáticos son diferentes. Generalmente, cuanto más compleja es la escena, mayores son los requisitos de rendimiento y mayor el costo del motor informático requerido.

El costo de cada etiqueta o servicio de etiquetas se puede calcular clasificando los costos de recolección, almacenamiento, diseño y procesamiento, uso y comercialización, etc., y rastreándolos y prorrateándolos entre cada etiqueta. Esto es muy importante para la operación comercial de etiquetas y servicios de etiquetado.

7. ¿Cómo leer el valor de la etiqueta?

7.1 Clasificación del valor de la etiqueta

7.1.1 Optimización de la gestión comercial interna de las empresas

El uso de etiquetas en aplicaciones de datos, como análisis de datos, monitoreo y alerta temprana, puede ayudar a los operadores comerciales a analizar mejor el estado de los enlaces principales en sus procesos comerciales y lidiar con alarmas anormales lo antes posible.

7.1.2 Empoderamiento empresarial de datos externos de la empresa

Las etiquetas cooperan con los motores de datos correspondientes para generar interfaces de servicios de datos o aplicaciones de datos, y las empresas proporcionan estos servicios o aplicaciones de datos externamente como un nuevo tipo de servicio de datos. Este negocio de datos traerá ingresos comerciales a la empresa.

7.1.3 Industria de comercio de datos compatible

En el proceso de transacciones de datos, garantizar el cumplimiento, la seguridad y la equidad de los datos es la máxima prioridad. Si se puede explorar un nuevo mecanismo en el que los usuarios de servicios de etiquetas paguen por usar etiquetas, entonces el valor de la etiqueta se puede calcular a través de las tarifas de uso del servicio medidas por la plataforma y, en última instancia, se puede lograr la trazabilidad inversa.

7.1.4 El valor social de beneficiar los medios de vida de las personas

Además de las empresas, los gobiernos y las instituciones también necesitan potenciar los activos de datos. Los cerebros digitales y las ciudades inteligentes que muchas ciudades están construyendo son módulos de soporte de big data. A través de una gran cantidad de datos, los gobiernos, instituciones, etc. pueden realizar evaluaciones razonables de la situación actual, predecir y advertir tendencias y riesgos de desarrollo y elaborar planes generales.

7.2 Cómo medir el valor de la etiqueta

7.2.1 Enfoque de ingresos

En el proceso de gestión interna de la empresa y empoderamiento empresarial de datos externos, el método de ingresos se puede utilizar para medir el valor de los servicios de etiquetas. La cantidad de costos internos que se han reducido, la cantidad de ingresos comerciales externos que se han aumentado y la cuantificación monetaria de estos beneficios se consideran el valor específico que los servicios de etiquetado aportan a las empresas.

7.2.2 Enfoque de mercado

En la industria del comercio de datos compatible, los servicios de etiquetas son cotizados por un determinado proveedor de producción y los consumidores hacen contraofertas basadas en necesidades reales o compran otros servicios de etiquetas a precios más bajos.

7.2.3 Método de costo

Para los servicios de datos abiertos al público en general, ¿cuánto dinero han invertido acumulativamente el gobierno, las instituciones y las empresas en el diseño, la construcción y el funcionamiento continuo? Esta inversión continua en costos de construcción de datos se puede utilizar como medida del valor del etiquetado. servicios.

8. Similitudes y diferencias entre la metodología de etiquetado y el modelado de almacenes de datos

Tanto la metodología de etiquetas como el modelado de almacenes de datos exploran cómo refinar, operar y procesar activos de datos. Ambos son métodos de construcción de activos de datos. Sin embargo, la metodología de etiquetas presta más atención a la clasificación, categorización y clasificación de los datos y negocios globales de la empresa. -Replicación de activos de datos orientada. El modelado del almacén de datos se centra en la gobernanza de datos, la especificación de datos y el modelado de dominio. A través del modelado de dominio, puede ver porciones de datos existentes en un determinado escenario empresarial para resolver los problemas de datos actuales.

Supongo que te gusta

Origin blog.csdn.net/baidu_38792549/article/details/126664279
Recomendado
Clasificación