Comment les entreprises peuvent-elles activer les « éléments de données x » grâce à la capitalisation des données et créer une nouvelle productivité ?

À l’échelle mondiale, les données, en tant que facteur de production émergent, jouent un rôle essentiel dans les activités économiques et commerciales mondiales, favorisant ainsi l’essor vigoureux de l’économie numérique. Selon des prévisions prospectives, d’ici 2025, la contribution des flux de données mondiaux à la croissance économique globale devrait atteindre la somme stupéfiante de 11 000 milliards de dollars américains.

Ces dernières années, l’ attention portée par le pays aux éléments de données s’est accrue. Le 31 décembre 2023, 17 départements, dont l'Administration nationale des données, ont publié conjointement le Plan d'action triennal « Éléments de données × » (2024-2026), la construction d'une économie numérique avec les données comme élément clé est une exigence inévitable pour promouvoir un niveau élevé. -développement de qualité.

Il est prévisible qu'en 2024, une nouvelle ère « data× » démarrera pleinement, libérant l'effet multiplicateur des données et catalysant le développement d'une nouvelle productivité. La voie clé pour atteindre cet objectif consiste à promouvoir le processus de capitalisation des données , à utiliser les éléments de données pour piloter les changements commerciaux et à valoriser les données.

Cet article approfondira la définition et l'importance des éléments de données et de la capitalisation des données, et clarifiera leurs rôles clés dans le contexte du Big Data. Dans le même temps, nous déterminerons la voie à suivre pour réaliser la valorisation des données et la manière de réaliser la valeur applicative des données, afin de permettre le développement innovant des entreprises dans la nouvelle ère et de réaliser des mises à niveau commerciales et des transitions de valeur.

Éléments de données et capitalisation des données

Que sont les éléments de données ?

Selon le « Livre blanc sur les éléments de données (2022) », les éléments de données font référence à des ressources de données qui participent à la production sociale et aux activités commerciales et apportent des avantages économiques aux propriétaires ou aux utilisateurs. Par conséquent, le terme « éléments de données » est orienté vers l'économie numérique. La référence aux « données » dans le contexte de la discussion sur la productivité et les relations de production met l'accent sur la valeur des données dans la promotion de la production. sur des besoins de production spécifiques. Les données informatiques collectées, triées et traitées et leurs formes dérivées, les ensembles de données originaux, les ensembles de données standardisés , divers produits de données investis dans la production et les systèmes, informations et connaissances générés sur la base des données peuvent tous être inclus dans le discussion sur la catégorie des éléments de données.

Les propriétés fondamentales des éléments de données incluent l'unicité, l'atomicité et la clarté de la définition, qui permettent de les identifier, de les traiter et de les analyser avec précision par le système. Par exemple, nos numéros de téléphone mobile, nos adresses e-mail, nos enregistrements de navigation sur le Web, etc., sont tous des éléments de données qui peuvent être collectés, stockés, analysés et utilisés pour nous aider à prendre de meilleures décisions et solutions.

La nécessité de la capitalisation des données

Dans l’économie numérique, il est crucial de garantir une utilisation efficace et sécurisée des données. La mise en œuvre de la valorisation des données est la base de la construction d’un système d’assurance de la qualité et de la sécurité des données. La capitalisation des données comprend des règles et des normes pour la collecte, le stockage, l'utilisation et le partage des données. En outre, la capitalisation des données implique également des exigences de protection de la confidentialité des données et de conformité pour garantir que l'utilisation des données ne porte pas atteinte aux droits personnels ou ne viole pas les lois et réglementations.

Par conséquent, on peut dire que la capitalisation des données est la base de la réalisation de « l'élément de données x ». Ce n'est que grâce à une gestion standardisée des actifs de données que les conditions permettant aux données de réaliser une valeur économique peuvent être créées. Grâce à la capitalisation des données, l'acquisition, le stockage, le traitement, le partage et l'utilisation des actifs de données peuvent être mieux gérés, et la fiabilité, l'exactitude et la sécurité des données peuvent être améliorées.

Comment réaliser la capitalisation des données ?

Avec l'aide de la « plateforme de gestion des actifs de données » de Kangaroo Cloud , grâce à un lien complet de collecte de métadonnées, de gestion des métadonnées et d'analyse des métadonnées, des informations de métadonnées standardisées sont collectées et conservées, et le réseau de relations de données est ouvert, afin que les entreprises puissent réaliser la capitalisation des données. La normalisation et la gestion standardisée.

En outre, les entreprises peuvent comprendre l'ensemble des actifs de données grâce à l'inventaire des actifs , combiné à des fonctions de gestion et de contrôle de la sécurité des données, pour fournir une base de métadonnées « complète, unifiée et connectée » pour l'exploration de la valeur des données et libérer pleinement le potentiel des éléments de données. et stimuler l'innovation et les mises à niveau des entreprises.

Collecte de métadonnées

La collecte de métadonnées est la base de la réalisation de la valorisation des données. Pour collecter des informations sur les métadonnées, vous devez d'abord effectuer des recherches internes pour trier les données commerciales, les données d'entrepôt de lac ou les données d'application dont l'entreprise a besoin pour mener une gestion unifiée des métadonnées. Après avoir collecté les informations de connexion à la source de données de différents types de données, demandez des autorisations de métadonnées en lecture seule auprès de chaque personne chargée de collecter les métadonnées.

déposer

Après une connexion réussie à la source de données, des tâches de synchronisation périodiques et des tâches de synchronisation temporaires pour des sources de données ou des bases de données spécifiques peuvent être créées via la « plateforme de gestion des actifs de données » de Kangaroo Cloud. S'il existe des informations sur les tables de base de données qui n'ont pas besoin d'être collectées et conservées, vous pouvez définir des conditions de filtrage de base de données et des conditions de filtrage de tables de données pour empêcher la synchronisation de bases de données/tables sans importance avec la plate-forme d'actifs, et prendre en charge la configuration du contenu de synchronisation temporaire des métadonnées. et le cycle de planification des tâches de synchronisation.

déposer

Une fois la synchronisation terminée, la plateforme collectera automatiquement les informations de métadonnées des tables de données sous chaque type de source de données, telles que la base de données à laquelle elle appartient, l'heure de création de la table de données, l'heure de la dernière modification du DDL, le stockage. l'emplacement, la taille du stockage, le format de stockage, le nombre de lignes du tableau et le type de tableau ainsi que d'autres informations sur les attributs techniques, et terminer le travail de maintenance préliminaire de l'actif des données.

déposer

Gestion des métadonnées

Une fois la collecte des métadonnées terminée, une gestion standardisée des métadonnées peut être effectuée en fonction des besoins spécifiques de l'entreprise afin d'améliorer la qualité de la valorisation des données. Tout d'abord, vous pouvez communiquer hors ligne avec la personne responsable de chaque source de données sur le manque de métadonnées, discuter des spécifications de conception du modèle de métadonnées, répertorier les éléments de métadonnées qui doivent être conservés pour chaque type de source de données et les saisir dans la plateforme. .

déposer

Deuxièmement, les méthodes de maintenance des métadonnées peuvent être utilisées pour désigner une personne responsable de chaque élément de métadonnées afin de garantir que le travail de maintenance des métadonnées puisse être confié à la personne responsable. La personne responsable doit conserver complètement les informations de métadonnées manquantes conformément à l'arrangement, et tout le personnel de maintenance peut ajouter des balises personnalisées aux actifs de données pour faciliter une interrogation rapide des informations sur les actifs de données en fonction de la classification des balises. Les gestionnaires peuvent régulièrement compter l'intégrité des métadonnées et suivre la progression de la maintenance des métadonnées. Ils peuvent effectuer des statistiques régulières basées sur plusieurs dimensions telles que les sources de données et les personnes responsables, découvrir les problèmes en temps opportun et exhorter les personnes responsables à améliorer les informations sur les métadonnées.

déposer

Dans le même temps, grâce aux capacités de gestion des normes de données fournies par la plateforme , les informations standard au niveau du champ des actifs de données peuvent être standardisées. Grâce à la gestion racine et à la gestion standard, les informations standard des champs de la table de données sont définies, telles que le nom du champ, le nom chinois du champ, le type de champ, la longueur du champ et d'autres informations.

déposer

Analyse des métadonnées

Une fois la collecte et la gestion des métadonnées terminées, l'analyse peut être effectuée sur la base des informations sur les métadonnées. La plate-forme fournit une analyse d'exhaustivité, une analyse de la qualité et une analyse de lignage des métadonnées , et analyse et intègre de manière exhaustive les informations sur les actifs au sein de l'entreprise pour faciliter efficacement les entreprises. gérer les actifs de données.

Analyse d'exhaustivité : pourcentage d'exhaustivité statistique, prenant en charge l'analyse statistique à partir de plusieurs dimensions, notamment le niveau de la plate-forme, le niveau du type de source de données , le niveau de la source de données, le niveau de la base de données, le niveau de la personne responsable et le niveau d'attribut spécifique. Par exemple, lors de la réalisation d'analyses statistiques en fonction de la dimension du responsable, les résultats statistiques peuvent être pleinement utilisés pour promouvoir et superviser les développeurs de données afin de maintenir les informations de métadonnées de manière opportune et complète.

déposer

Analyse de la qualité : la plate-forme offre des capacités de vérification de la qualité et peut fournir une variété de scénarios de surveillance de la qualité . Elle intègre de riches fonctions de vérification pour la vérification d'une seule table et la comparaison de plusieurs tables afin de répondre aux besoins des entreprises en matière d'actualité, d'exhaustivité, de cohérence et de cohérence des données. et Exigences en matière de vérification multidimensionnelle de la validité et de l'exactitude. Grâce au processus de configuration des règles pré-événement, de vérification des règles lors de l'événement et de rapport d'analyse post-événement, une évaluation multidimensionnelle des données est effectuée pour garantir la qualité des données de l'entreprise.

déposer

Analyse des liens de sang : grâce à la capacité d'analyse des liens de sang , les entreprises peuvent découvrir rapidement certaines tables qui ont certainement des liens de sang, mais les liens de sang sont manquants, comme les tableaux aux niveaux en aval des entrepôts de données, les rapports BI, etc. Les entreprises peuvent configurer une base de données qui doit surveiller les liens de sang. La plate-forme utilisera les résultats de l'analyse SQL des liens de sang et les statistiques des tables de liens de sang isolées dans la base de données pour aider les entreprises à surveiller la qualité des actifs de données et à optimiser l'espace de stockage des actifs. .

déposer

Inventaire et affichage des actifs

La plate-forme fournit une fonction de cartographie des données , qui résume toutes les données des actifs de l'entreprise, y compris les tables de base de données, les tâches de développement, les indicateurs, les balises, les API et d'autres types d'actifs de données, offrant aux utilisateurs un portail de requête de métadonnées unifié, complet et pratique . Il prend en charge une variété de modes de recherche et de conditions de filtrage pour localiser rapidement les métadonnées. Il peut également découvrir en permanence les métadonnées manquantes en fonction des résultats de la requête et prendre en charge la maintenance des métadonnées.

déposer

Dans le même temps, la plate-forme fournit également un tableau de bord des actifs , grâce auquel les entreprises peuvent analyser l'évolution des tendances, la distribution, le classement des valeurs, les proportions de stockage et d'autres informations sur l'ensemble des actifs afin de comprendre pleinement la situation globale des actifs de données. Fournir à la direction un accès à la visualisation des actifs pour l’aider à prendre des décisions sur les orientations de construction.

déposer

Contrôle de la sécurité des données

La gestion de l'actif des données est indissociable du contrôle de la sécurité des données . La « plateforme de gestion des actifs de données » de Kangaroo Cloud prend en charge la gestion des règles de désensibilisation des données , la gestion des autorisations de données et la classification des données. Pour certaines données sensibles, telles que les numéros de téléphone mobile, les numéros d'identification et autres informations privées, vous pouvez personnaliser les règles de désensibilisation pour un affichage désensibilisé. La plateforme prend en charge la configuration des autorisations au niveau des lignes et peut contrôler la portée des autorisations utilisateur en fonction de la classification des données et de la liaison avec les niveaux utilisateur pour obtenir un contrôle précis des autorisations de données.

déposer

Résumer

La capitalisation des données peut améliorer considérablement l'efficacité de la gestion des données des entreprises et explorer et réaliser pleinement la valeur applicative des données. Grâce à ce processus, les entreprises peuvent systématiquement classer, stocker et récupérer des données pour parvenir à une collecte unifiée de données au lieu d'être dispersées dans divers systèmes et fichiers.

Dans le même temps, le modèle de gestion unifié induit par la capitalisation des données joue un rôle clé dans le renforcement de la sécurité des données. Les entreprises peuvent désensibiliser et chiffrer les données et contrôler les niveaux de confidentialité pour garantir que seul le personnel autorisé peut accéder et modifier les données, garantissant ainsi la sécurité et la confidentialité des données dans la plus grande mesure et permettant aux entreprises d'utiliser pleinement les actifs de données dans le cadre de la conformité. la Fondation.

Les données sont le point de départ de tout.Les entreprises doivent attacher une grande importance à la promotion de la valorisation des données, renforcer les capacités de gestion des données et utiliser pleinement les actifs de données pour promouvoir le développement durable des entreprises.

Les utilisateurs ayant des besoins en ressources de données peuvent cliquer sur le lien ci-dessous pour essayer la [Plateforme d'actifs de données].

Plateforme d'actifs de données : https://www.dtstack.com/dtinsight/dataassets?src=szsm

Adresse de téléchargement du « Livre blanc sur le système d'indicateurs industriels » : https://www.dtstack.com/resources/1057?src=szsm

Adresse de téléchargement du « Livre blanc sur les produits Dutstack » : https://www.dtstack.com/resources/1004?src=szsm

Adresse de téléchargement du « Livre blanc sur les pratiques de l'industrie de la gouvernance des données » : https://www.dtstack.com/resources/1001?src=szsm

Pour ceux qui souhaitent en savoir ou en savoir plus sur les produits Big Data, les solutions industrielles et les cas clients, visitez le site officiel de Kangaroo Cloud : https://www.dtstack.com/?src=szkyzg

Linus a pris sur lui d'empêcher les développeurs du noyau de remplacer les tabulations par des espaces. Son père est l'un des rares dirigeants capables d'écrire du code, son deuxième fils est directeur du département de technologie open source et son plus jeune fils est un noyau open source. contributeur. Robin Li : Le langage naturel deviendra un nouveau langage de programmation universel. Le modèle open source prendra de plus en plus de retard sur Huawei : il faudra 1 an pour migrer complètement 5 000 applications mobiles couramment utilisées vers Java, qui est le langage le plus enclin . vulnérabilités tierces. L'éditeur de texte riche Quill 2.0 a été publié avec des fonctionnalités, une fiabilité et des développeurs. L'expérience a été grandement améliorée. Bien que l'ouverture soit terminée, Meta Llama 3 a été officiellement publié. la source de Laoxiangji n'est pas le code, les raisons derrière cela sont très réconfortantes. Google a annoncé une restructuration à grande échelle.
{{o.name}}
{{m.nom}}

Je suppose que tu aimes

Origine my.oschina.net/u/3869098/blog/11048376
conseillé
Classement