Introduction aux métadonnées et gestion de la base de données GaussDB

Table des matières

Introduction

2. Introduction aux métadonnées

1. Définition des métadonnées

2. Classification des métadonnées

3. Gestion des métadonnées de la base de données

3. Gestion des métadonnées de la base de données GaussDB

1. Gestion des métadonnées de la base de données GaussDB

2. Gérer (collecter) les métadonnées via "SQL + table système/vue système/fonction système"

1) Obtenir des informations telles que des tables, des vues et des champs de table

2) Obtenez des informations sur les tâches chronométrées

3) Obtenir des informations sur l'index

4) Obtenir des informations telles que les procédures stockées, les fonctions, les déclencheurs, etc.

4. Résumé

Introduction

GaussDB est une base de données relationnelle distribuée, et les métadonnées (tables, colonnes, vues, index, procédures stockées, etc.) en constituent une partie importante. Les métadonnées font référence aux données décrivant les données, y compris la définition des données, la structure, les attributs, les relations et d'autres informations. Cet article se concentre sur la base de données physique GaussDB et présente brièvement le contenu pertinent en combinaison avec le concept de métadonnées.

2. Introduction aux métadonnées

1. Définition des métadonnées

Selon la définition traditionnelle, les métadonnées (Metadata) sont des données qui décrivent des données. Les métadonnées enregistrent principalement la définition du modèle dans le système d'application de la base de données, la relation de mappage entre chaque niveau, l'état des données du système d'application de la base de données de surveillance et l'état d'exécution de la tâche d'ETL, etc. Dans les systèmes d'application de base de données, les métadonnées peuvent aider les administrateurs et les développeurs de bases de données à trouver très facilement les données qui les intéressent et à les utiliser pour les guider dans le travail de gestion et de développement des données, améliorant ainsi l'efficacité du travail.

2. Classification des métadonnées

Les métadonnées peuvent être classées selon différentes dimensions, et peuvent être divisées en deux catégories selon des finalités différentes : les métadonnées techniques (Technical Metadata) et les métadonnées métier (Business Metadata).

  • Les métadonnées techniques sont les données qui stockent les détails techniques du système d'application de la base de données et sont utilisées pour développer et gérer les données utilisées par le système d'application de la base de données. Les métadonnées techniques sont des actifs techniques, indiquant le nombre de bases de données, de tableaux de données, de volumes de données et leurs détails.
  • Les métadonnées d'entreprise décrivent les données dans le système d'application de la base de données d'un point de vue commercial. Elles fournissent une couche sémantique entre l'utilisateur et le système réel, de sorte que le personnel de l'entreprise qui ne comprend pas la technologie informatique peut également "comprendre" les données de la base de données. système d'application. Les métadonnées métier incluent les actifs métier et les actifs d'index. Les actifs métier affichent le nombre et les détails des objets métier, des entités logiques et des attributs métier. Les actifs d'index affichent les indicateurs métier et leurs détails.

3. Gestion des métadonnées de la base de données

La gestion des métadonnées correspond aux informations de description de l'ensemble du cycle de vie des données, telles que la collecte, le stockage, le traitement et la présentation des données, et aide les utilisateurs à comprendre les relations entre les données et les attributs associés. Les métadonnées d'une base de données font référence aux informations sur les objets de la base de données (tels que les tables, les colonnes, les index, les vues, les procédures stockées, etc.) qui décrivent la structure et les propriétés de ces objets. Et le but ultime est de servir la mise en œuvre efficace (développement, gestion, maintenance, etc.) du système d'application de la base de données.

3. Gestion des métadonnées de la base de données GaussDB

1. Gestion des métadonnées de la base de données GaussDB

En vous connectant à l'outil "Data Management Service (DAS)" fourni par GaussDB et en accédant à la page principale de "Library Management (Schema List/Object List/Metadata Collection)", la gestion de base des métadonnées associées peut être effectuée (comme indiqué dans le Figure ci-dessous).

Liste des objets de la base de données GaussDB :

  Collection de métadonnées de base de données GaussDB ( fonction intégrée de l'outil DAS) :

Conseil : les données de la liste d'objets proviennent d'une requête en temps réel (jusqu'à 10 000 éléments peuvent être affichés), ce qui consomme une certaine quantité de performances sur la base de données. Il est recommandé d'activer la collecte automatique des métadonnées.

2. Gérer (collecter) les métadonnées via "SQL + table système/vue système/fonction système"

1 ) Obtenir des informations telles que des tables, des vues et des champs de table

(1) Fonction d'informations système PG_GET_TABLEDEF(tablename) pour obtenir des informations de définition de table.

SELECT * FROM PG_GET_TABLEDEF('test_1');

 Type de retour : texte. Explication : pg_get_tabledef reconstruit l'instruction CREATE de la définition de table, y compris la définition de table elle-même, les informations d'index et les informations de commentaires. Pour le groupe, le schéma, l'espace de table, le serveur et d'autres informations dont dépend l'objet de table.

(2) La vue ADM_TABLES stocke des informations sur toutes les tables de la base de données. Champs principaux : propriétaire de la table, nom de la table, nom de l'espace table dans lequel la table est stockée, nombre estimé de lignes de la table, s'il s'agit d'une table temporaire, etc.

SÉLECTIONNEZ * À PARTIR DE ADM_TABLES ;

 (3) La vue DB_ALL_TABLES stocke les tables ou les vues auxquelles l'utilisateur actuel peut accéder. Champs clés : propriétaire de la table ou de la vue, nom de la table ou de la vue, tablespace dans lequel réside la table ou la vue.

SÉLECTIONNEZ * À PARTIR DE DB_ALL_TABLES ;

 (4) La vue DB_TABLES stocke toutes les tables accessibles à l'utilisateur courant. Champs principaux : le propriétaire de la table, le nom de la table, le nom de l'espace table où la table est stockée, le nombre estimé de lignes de la table, s'il s'agit d'une table temporaire, etc.

SÉLECTIONNEZ * À PARTIR DE DB_TABLES ;

(5) La vue ADM_TAB_COLUMNS stocke les informations de champ sur les tables et les vues. Il existe une ligne dans ADM_TAB_COLUMNS pour chaque champ de chaque table ou vue de la base de données. Champs principaux : propriétaire de la table, nom de la table, nom de la colonne, type de données de la colonne, longueur en octets de la colonne, etc.

SÉLECTIONNEZ * À PARTIR DE ADM_TAB_COLUMNS ;

 (6) La vue DB_TAB_COLUMNS stocke les informations de description des colonnes des tables et des vues accessibles à l'utilisateur courant. Champs principaux : propriétaire de la table, nom de la table, nom de la colonne, type de données de la colonne, longueur en octets de la colonne, etc.

SÉLECTIONNEZ * À PARTIR DE DB_TAB_COLUMNS ;

2 ) Obtenir des informations sur la tâche de synchronisation

La vue système MY_JOBS obtient ses informations de définition. Champs principaux : créateur du travail, exécuteur du travail, nom de la base de données correspondant au travail, heure de début d'exécution, heure de fin, état d'exécution, etc.

-- Obtenez des informations sur les tâches chronométrées

SELECT * DE MES_JOBS ;

3 ) Obtenir des informations d'index

La vue système PG_INDEXES obtient les informations d'index dans la table

-- Obtenir les informations d'index correspondantes en fonction du nom de la table

SELECT nom du schéma

      ,nom de la table

      ,nomindex

      , tablespace

      ,indexdef

À PARTIR DE PG_INDEXES

WHERE TABLENAME = 'sell_info_full'

ET INDEXNAME N'EST PAS NULL ;

4 ) Obtenir des informations telles que les procédures stockées, les fonctions, les déclencheurs, etc.

La vue DB_SOURCE stocke les informations de définition des procédures stockées, des fonctions et des déclencheurs accessibles à l'utilisateur actuel. Cette vue existe sous les schémas PG_CATALOG et SYS. Champs principaux : le propriétaire de l'objet, le nom de l'objet, le type de l'objet (fonction, procédure, déclencheur), la source texte de l'objet stocké, etc.

SÉLECTIONNEZ * À PARTIR DE LA SOURCE_DB ;

L'acquisition/la collecte des métadonnées de la base de données GaussDB se fait principalement par le biais de tables système, de vues, de fonctions, etc. Les métadonnées comprennent non seulement TABLES, VIEWS, COLUMNS, SOURCE, JOB, mais également USERS, COMMENTS, etc. Concrètement, la collecte et la gestion peuvent être réalisées en fonction des besoins réels de l'entreprise.

4. Résumé

Gestion des métadonnées D' un point de vue technique , les métadonnées gèrent les métadonnées techniques telles que le système de source de données d'une entreprise, la plate-forme de données, l'entrepôt de données, le modèle de données, la base de données, la table, le champ et la relation de données entre les champs. D' un point de vue métier , les métadonnées gèrent les métadonnées métier telles que le glossaire métier d'une entreprise, les règles métier, les règles de qualité, les politiques de sécurité, les politiques de traitement des tables et les informations sur le cycle de vie des tables. Du point de vue des systèmes d'application , la gestion des métadonnées fournit un traitement complet et un suivi complet des données, ce qui facilite la traçabilité et l'audit des données, ce qui est de plus en plus important pour l'utilisation conforme des données. Grâce à l'analyse de la lignée des données, retracez la cause profonde des problèmes de qualité des données et d'autres erreurs, et effectuez une analyse d'impact sur les métadonnées modifiées, etc.

La gestion des métadonnées de la base de données GaussDB est l'un des cœurs de la gestion du système de base de données. Il peut aider les utilisateurs à mieux gérer et maintenir la base de données, à améliorer la sécurité et la fiabilité des données et à réduire le risque de perte et de détérioration des données. Dans le même temps, la gestion des métadonnées peut également aider les utilisateurs à mieux comprendre et utiliser la base de données et à améliorer l'efficacité du travail.

--Finir

Je suppose que tu aimes

Origine blog.csdn.net/GaussDB/article/details/132098621
conseillé
Classement