タグカテゴリシステム (ビジネス指向のデータ資産設計方法論) - 読書メモ 4

第 4 章: 4 つの基本原則

1. ビジネスとデータの連携の発展

(1) V1.0: 有効

プラットフォーム ツールを使用してデータ処理の運用効率を向上させ、技術的な運用の敷居を下げることは、技術者がデータを活用できるレベルです。

(2) V2.0: 高速化

これは、データセンター内のテクノロジー、データ、文化の 3 つの要素を統合して、変化に対応する企業のビジネス能力を向上させる方法です (データセンター戦略の核心は、ビジネス担当者が再現可能な技術的手法を使用して、迅速にデータセンターを構築できるようにすることです)企業の担当者は、試行錯誤を重ねながらデータをより高速に使用します。

(3) V3.0: スマート

データをインテリジェントかつ効果的に使用するために、データ オペレーティング システムがよりインテリジェントに意味を理解し、データ リンク全体を自動的に操作できるようにする一方で、継続的なイノベーションとデータ アプリケーションの徹底的な探索により、データを自ら生成し再現する、生活レベル。

タグ カテゴリ システム方法論の最初の原理は「ツリー構造のタグ ツリー」です。この基本原理は、4 つの主要な二次理論を通じて具体的に詳しく説明できます。

  • 根、枝、葉/花
  • エネルギー、栄養素、そして枯れる
  • フラクタル構造と資産植樹モデル
  • アセットツリーの使用パターンの推定

2. 根、枝、葉/花

2.1 木の根によってその木の種類が決まる

ラベル カテゴリ システムの設計は、「ルート ディレクトリ」から開始する必要があります。「ルートディレクトリ」に対応するデータ粒度は「オブジェクト」です。オブジェクトは、エンティティ オブジェクトと関係オブジェクトに分類されます。したがって、ラベル カテゴリ ツリーには、エンティティ ツリーと関係ツリーという 2 つの主要なタイプがあります。

2.2 樹幹の対応ラベルの分類

ツリーの枝は、ラベル カテゴリ システムのカテゴリ、つまりラベル分類に対応します。カテゴリは継続的に区別できるフラクタル構造であり、シーンのニーズに応じて、任意のサブシステムをインターセプトして独立したラベル カテゴリとして使用することもできます。カテゴリはラベルの分類であり、オブジェクトではありません。

2.3 樹葉/花部門指示ラベル

木の葉や花の部分は、オブジェクトのさまざまな属性、つまりラベルに対応します。タグはデータベース テーブルのフィールドにマッピングされます。これは、多数のデータ アプリケーションの実践によって検証された、最も適切なデータ資産の粒度です。根、枝、葉/花が互いに接続されて、タグ ツリーの基本構造を形成します。

2.3.1 葉と花は動的タグと静的タグのようなものです

(1) 動的タグと静的タグの違い: 動的タグと静的タグの違いは、タグの下にある個々のオブジェクトのタグ値が頻繁に変更されるかどうかにあります。

(2) 動的タグと静的タグの関係: 静的タグの値は動的タグの値に影響を与える可能性があります。性別値が女性の場合、一部の行動アクションタグの値に影響を与える可能性があります。静的タグの値は、多数の動的タグの値から推測および計算できます。たとえば、多数の消費、閲覧、およびコレクションのタグ値を通じて、性別タグの値を推測できます。

2.3.2 葉と花のような遺伝子は集団の形状に影響を与える

カテゴリツリー上の葉や花は遺伝子の断片のようなもので、1つ1つマッピングされて集団内の個体の属性性能に影響を与え、個体ごとに異なりますが、集団内の正常な個体は同じ数の遺伝子タイプを持っています。そして規格も統一されています。

2.3.3 タグ カテゴリ システムは本質的にオブジェクト属性のパターン設計です

特定のタイプのオブジェクトのラベル カテゴリ システムの設計により、実際には、そのタイプのオブジェクトの属性のスキーマ設計が完了します。適切に設計されたラベル カテゴリ システムは型のようなもので、このタイプのオブジェクトの下にある特定の個人のイメージの特徴をすばやく描写できます。

2.3.4 ラベルとラベルデザインの違い

ラベリングは、特定のインスタンス ツリーの葉の色付け、つまりラベル値のマーク付けまたはラベル値の計算に似ています。ラベル デザインはテンプレート レベルでの形状デザインであり、この 2 つは同じ緯度にありません。

2.3.5 メタタグ

葉や花自体がオブジェクトの属性を記述するものと、葉や花の属性を記述する属性がいくつかあり、これらのタグを記述するためのタグをメタタグと呼びます。

タグ システムの設計者は、データ記述方法を使用して、統一された方法でオブジェクトの本質を記述します。つまり、過去の個々の現象を要約するのではなく、個々の観察をグループの観察にアップグレードし、将来のシナリオに適応する能力を備えています。

3. エネルギー、栄養素、腐敗

3.1 エンティティ ツリーは関係ツリーを介して接続されます

リレーションシップ ツリーは異なるエンティティ ツリーを接続しますが、ダイナミック タグは単にリレーションシップ ツリーからリーフを選択してエンティティ ツリーに貼り付けることはできません。対象物の角度の変換と統計形式の変換を経る必要があります。

3.2 エンティティ ツリーの葉からバックトラックしてリレーションシップ ツリー フォレストを開く

エンティティ オブジェクトの動的カテゴリ ラベルは、多くの場合、統計またはアルゴリズムを通じて計算され、一連の詳細な動作データを再処理することによって取得されます。したがって、エンティティ オブジェクト ツリー上の「色付き」動的リーフは、多くの場合、多数の特定の詳細な動作リーフにまで遡ることができ、特定の関係エンティティ ツリー フォレストを開くこともできます。

3.3 リレーションシップツリーはエンティティツリーにエネルギーを与える

エンティティ オブジェクトのタグは、それに関連するリレーションシップ オブジェクトの数が増加するにつれて増加し、充実します。新しいアクション、動作、または接続、つまり関係ツリーが追加されるたびに、新しいタイプのリーフがエンティティ ツリー上にマッピングされ、変換されます。

3.4 業務用はタグツリーへの栄養供給

タグがビジネスで広く使用されている場合、タグの価値は非常に安定しており、データ ガバナンス、リソースの優先順位、運用マーケティングなど、データ資産システム内で対応するサービス保証が受けられます。棚に置かれたり、まったく業務用に使用されない場合は、栄養不足により枯れて棚から撤去されます。再利用価値のないタグを棚から削除することは、タグのライフサイクルプロセスとして考慮する必要があり、そうでないと、企業はデータ項目がますます増加し、管理および運用コストが増加するデータ資産爆発のリスクに簡単に直面することになります。巨大になるだろう。

3.5 最後に木ではなく森を取り出す

各エンティティ オブジェクトとリレーションシップ オブジェクトは独立したカテゴリ ツリーを形成し、タグ カテゴリ システムを使用してエンタープライズ データ資産を分類した後、通常、多数のツリー構造が分類されます。リレーションシップ ツリー構造が形成されると、その構造は比較的安定し、形状が変化する可能性は低くなりますが、エンティティ ツリーは、リレーションシップ ツリーが追加されたり破棄されたりすると、対応するツリー形状が変化します。

企業が維持に重点を置く必要があるのは、頻繁に使用され、再利用価値のあるエンティティ ツリーです。ビジネス関係は現象であり、エンティティは多くの場合ビジネスの本質です。

4. フラクタル構造とアセットツリー植栽モデル

タグカテゴリツリーは、生命の進化の樹のように、エネルギーや環境の影響によって常に分化し、豊富なタグクラスターを形成し、適者生存と自然選択を経ていきます。データ資産の構築の目的とペースに応じて、参照用の 2 つのモデルがあります。

4.1 浅いところから深いところまでの完全な計画

資産を構築する目的が、データ資産の完全な計画を作成し、データの収集、並べ替え、処理、マイニング、その他の作業段階をガイドすることであり、データ資産の全体的な計画を実装するために長い時間を費やすことをいとわない場合、これはモデルを使用できます

  • オブジェクトのクラシック カテゴリ ツリーで最も基本的なブランチを選択し、必要に応じて基本ブランチ カテゴリの下にラベルを追加して、バージョン 1.0 のコンシューマ ラベル カテゴリ システムを形成します。
  • 事業展開のニーズに応じて、中円、大円といった包括的な拡張が行われ、その際にカテゴリツリーが徐々に成長し、多くのカテゴリと豊富なタグが追加されます。
  • 一方的な拡大は、既存の基礎データや事業展開が比較的単純な場合や、特定の事業が急速に発展し、ある種のタグが急速に発展する場合にも発生する可能性があります。

どの方法を使用する場合でも、根から基本幹、細分化された枝、そして葉に至るまで、全体的な計画のアイデアを反映する必要があります。

  • 利点: 包括的な計画、未来志向、データ面での企業の包括的なレイアウトを把握している
  • デメリット:構築期間が長く成果も遅いため、大きな抵抗に見舞われる 包括的なデータセット資産の計画から実装までを最終的に完了させるのはプロジェクトのトップリーダーでなければならない。

4.2 深くまで侵入し、一部からの直接迎撃

企業が資産を構築する目的がビジネス シナリオをサポートすること、特に複数のビジネス シナリオ間でタグ資産を迅速に再利用できるようにし、データの有効性を迅速に低下させることである場合、このモードを選択できます。

オブジェクトのクラシック カテゴリ ツリーのタスク部分から必要な枝を直接切り取り、根と葉を組み立てるだけです。ラベルカテゴリシステムはフラクタル構造であるため、全体と部分が同型であり、任意の局所枝を独立したカテゴリツリーとして切り出すことができる。

  • 利点: タグはビジネスに直接影響を与え、すぐにビジネスの糧を得ることができ、データの価値を提示し、疑問や抵抗がほとんどありません。
  • 短所: ビジネスやレーベルが変化や調整を続けると、カテゴリー構造全体が大きく変化したり、場合によっては再構築されたりするため、より大きな影響が生じます。

進化の過程において重要なのは、ある系統の最終進化ではなく、分化を続ける枝である。企業は、グループ全体の複数の業態や部門から可能な限り多くのデータを整理し、エネルギーマッピングと遺伝子クロスオーバーを継続的に実行し、豊富で興味深いタグクラスターを形成し、タグカテゴリシステムを通じてそれらを秩序だった方法で整理および整理する必要がありますそのため、データ資産は将来のさまざまなシナリオのニーズを満たすことができるだけでなく、非常に強力な自己反復機能と良好な持続可能性も備えています。

5. 資産ツリー使用モデルの推論

タグ カテゴリ システム手法を通じて形成されたデータ資産ライブラリには、資産リストと資産エンティティが含まれます。

  • 資産リスト: 資産リストは資産カタログに似ており、ユーザーは資産カタログ/ポータル/マーケット インターフェイスを通じてすべてのオブジェクトのラベル カテゴリ システムを明確に確認できます。特定のツリーを選択すると、ツリーの特定のブランチのアウトライン (第 1 レベルのディレクトリ、第 2 レベルのディレクトリなど) が表示されます。リーフ カテゴリを選択すると、そのカテゴリに含まれるすべてのタグのリストが表示されます。各タグは固有の葉のようなもので、ID、名前、ロジック、タイプ、値辞書などの独立したメタ タグ値を持ちます。
  • アセット エンティティ: アセット エンティティは、設計されたタグ カテゴリ ツリー モードにおける特定の個別のインスタンス、つまり各オブジェクトの個別です。すべての資産エンティティには、オブジェクト カテゴリ ツリーに含まれるラベルとラベル分類があり、単に異なる色の特定のツリーと考えることができます。ライブラリ テーブル ストレージ レベルでは、アセット エンティティを、処理されたタグ テーブル内の各特定のデータ レコードにマッピングできます。これらのデータ レコードには、統一された標準の列情報がありますが、特定の列の値は異なります。

5.1 クエリサービス

  • 何を探すかを決める
  • クエリサービスの作成
  • クエリサービスが作成されると、APIまたは対話型インターフェースが生成され、特定の業務システムや業務担当者がAPIを呼び出したり、インターフェースシステムの操作を通じてサービスを利用したりすることができます。

5.2 分析サービス

分析サービスは、ビジネス システムにおける OLAP 分析データの操作でよく使用されます。そのプロセスは次のとおりです。

  • 何が分析対象なのかを明確に整理する
  • オブジェクトを選択し、サービス管理でサービス タイプ「分析」を選択し、サービス作成プロセスに入ります。
  • 分析サービスはアカウントを作成すると API または対話型インターフェイスを生成し、特定のビジネス システムまたは業務担当者は API またはインターフェイス オペレーティング システムを通じてサービスを使用できます。

データ分析は、特定の属性ラベル上のオブジェクトの値、つまり、特定の緯度セクション上の紅葉のさまざまな変形を処理することであり、値の分布は、さまざまなデータ上の定量的表現への色の分布の変形です。平均化とは、さまざまな色の量的な違いを最終的に調和のとれた色に変換することです。

5.3 サークル選択サービス

円選択サービスは、特定の対象オブジェクトの操作によく使用されます。最初にオブジェクトが確認され、選択されます。円選択サービスが作成された後、API または対話型インターフェイスが生成されます。特定の業務システムまたは業務担当者は API を呼び出すことができますまたはインターフェースシステムの操作を使用します。

おすすめ

転載: blog.csdn.net/baidu_38792549/article/details/125715393