データアプリケーションシナリオのラベル管理システム

1つ、ラベルの紹介

ラベルのコンセプト

ラベルは元々、オブジェクトの名前、重量、体積、目的などの簡単な情報を示すなど、物理的なオブジェクトを分類してマークするために使用されていました。その後、データにラベルを付け、データを迅速に分類および分析することが、データ業界で徐々に普及しました。

ラベル機能

ライフサイクル特性を備えたポジショニングと検索の正確な説明は、計算、構成、および正規化された処理が可能です。タグを使用して、さまざまな構造化および非構造化[ドキュメント、写真、ビデオなど]データを記述できるため、これらのコンテンツを効率的に管理できます。

  • 機能の説明:ラベル[電話の色]、機能[赤、白];
  • ルールの説明:タグ[アクティブユーザー]、ルール[毎日ログイン、トランザクションの生成];

ラベル値

  • 洗練された操作の基盤は、トラフィックの精度と効率を効果的に向上させます。
  • 製品が需要データをすばやく見つけて正確な分析を実行できるようにします。
  • 顧客が市場サイクルに早く切り込むのを助けることができます。
  • データとタイムリーな応答の詳細な予測分析。
  • タグに基づいたインテリジェントなレコメンデーションシステムを開発します。
  • 特定のカテゴリでのデータ分析に基づいて、業界の特性に関する洞察を得る。

ラベルのコアバリュー、または最も一般的に使用されるシナリオ:リアルタイムのインテリジェントな推奨、正確なデジタルマーケティング。

2、ラベルの定義

属性ラベル

属性タグは、基本的な特性を記述し、動作の生成を必要とせず、ルールエンジン分析に基づいていません。たとえば、ユーザーの実名認証情報に基づいて、性別、誕生日、生年月日などの特性を取得できます。変化の頻度は非常に少なく、精度は高いです。

行動ラベル

さまざまなビジネスチャネルにポイントを埋め、ユーザーの行動データをキャプチャし、これらのデータを分析して結果を説明するラベルを作成します。たとえば、ユーザーの「オンラインショッピングプラットフォーム」を分析すると、得られる結果はPinduoduo、Taobao、Jingdong、Tmallなどです。 。これらは、行動データによって判断する必要があるタグです。

ルールラベル

ルールに基づいて分析されるラベルは、製品または運用の観点に基づいています。たとえば、eコマースプラットフォームは、メンバーシップレベルが5を超え、過去7日間アクティブであるメンバーに1つのメリットを提供する必要があります。2つラベルアプリケーションはここに含まれます:1。「メンバーシップレベル」は判断するルールに基づいています。2。「過去7日間にアクティブ」を判断する方法は、ログインまたはトランザクションの動作に基づいているかどうかにかかわらず、動的に構成する必要があります。次に、ルールエンジンに基づいて結果が生成されます。動的ルール構成に基づいて、計算と分析の後に、説明ラベル、つまりルールラベルが生成されます。

フィットラベル

タグのフィッティングは非常に複雑です。複数のタグのインテリジェントな組み合わせ分析により、予測的な説明が与えられたり、複数の特性やアイコンタクト情報のアクティビティを通じて人間の心理を判断するいわゆるマインドリーディングテクニックなどの高度な定義が直接与えられます。機械学習には、「ユーザーの行動を長期的に判断して学習することで、ユーザーよりもユーザーをよく知ることができる」ということわざがあります。

三、ラベル管理システム

階層分類

ラベル管理の基本的な方法は、通常、金融、教育、娯楽などの業界ごとに分けられます。管理は、マルチレベル分類によって洗練されています。

ベースラベル

つまり、データのキーラベル、特性は正確でフラットであり、メタデータと同様に、データを正確に記述するために使用して細分化することはできません。データ特性を記述するために複数のタグが使用される場合、構造化テーブル管理が形成されます。

タグ値タイプ

値のタイプ:数値、辞書、ブール値、日付、テキストボックス、カスタムなど。これは、ラベルの特定の値の管理です。たとえば、ラベル「gender」とラベル値「male.female.unknown」は、辞書を一覧表示することで説明される典型的なシナリオです。

第四に、ラベルの製造プロセス

1.基本的なプロセス

データ収集

同じAPP内のさまざまなビジネスライン(ショッピング、支払い、資産管理、持ち帰り、情報閲覧など)など、データ収集には比較的多くのチャネルがあります。これは、データチャネルを介して統合データ集約プラットフォームに送信されます。これらの大量のログデータのサポートにより、データ分析の基本的な条件が利用可能になります。データインテリジェンス、ディープラーニング、アルゴリズムなどは、大量のデータの基本条件に基づいているため、貴重な分析結果を得ることができます。

情報処理

上記のビジネスと組み合わせて、大量のデータの処理、分析、抽出を通じて、比較的正確なユーザータグを取得するための重要なステップがあります。これは、既存のユーザータグ、特にルールクラスとフィッティング関連を継続的に検証および修復することです。クラスのタグ。

タグライブラリ

タグライブラリを介して、複雑なタグの結果が管理されます。複雑なタグとタイムラインベースのタグの変更に加えて、タグデータはすでにここでかなりの価値があります。一般的なサービスなど、一部の有料サービスはタグライブラリの周りで開くことができます。 eコマースAPPが特定の製品を閲覧すると、情報フロープラットフォームで製品の推奨事項を確認できます。ビッグデータの時代はとても賢くて息苦しいです。

ラベル事業

データが大きな円を通過してラベルに変換された後、ビジネスレベルに戻るのは自然です。ラベルデータのユーザーの分析を通じて、正確なマーケティングとインテリジェントな推奨を実行できます。Eコマースアプリケーションはトランザクション量を増やすことができます。中国はユーザーをより引き付けることができます。

アプリケーション層

上記のビジネスをサービスに発展させ、既存のアプリケーションレベルに統合し、アプリケーションサービスの品質を継続的に改善し、ユーザーを継続的に引き付けてサービスを提供します。もちろん、ユーザーのデータは常にアプリケーションレベルで生成され、データ収集サービスへの転送では、完全な閉ループプロセスが最終的に形成されます。

2.データ集約プール

  • IDmappingテクノロジーに基づいて、一意の識別子[uid]を置き換えます。
  • uidに関連付けられたラベルに基づいて、それをコンピューティングプールに配置します。
  • 同じuidで運ばれるタグは、ヘビのように動作します。
  • uidの下で運ばれるラベルコンテンツを継続的に強化します。

この方法でラベリングシーンを充実させ、より大きなデータ値を生成します。

5、ソースコードアドレス

GitHub·地址
https://github.com/cicadasmile
GitEE·地址
https://gitee.com/cicadasmile

データインサイトシリーズの記事

シリアルナンバー 題名
01 データ分析:スマートタグに基づいて、データを正確に管理します
02 データ分析:データ視覚化チャート、BIツール構築ロジック
03 データ分析:複雑なビジネスシナリオにおける定量的評価プロセス

推奨読書:プログラミングシステムの仕上げ

シリアルナンバー プロジェクト名 GitHubアドレス GitEEアドレス 推奨
01 Javaは、デザインパターン、アルゴリズム、およびデータ構造を記述します GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆☆
02 Javaの基礎、並行性、オブジェクト指向、Web開発 GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆
03 SpringCloudマイクロサービスの基本コンポーネントケースの詳細な説明 GitHub・ここをクリック GitEE・ここをクリック ☆☆☆
04 SpringCloudマイクロサービスアーキテクチャの実際の戦闘の包括的なケース GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆☆
05 SpringBootフレームワークの基本的なアプリケーションから高度なものまで GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆
06 SpringBootフレームワークは、一般的なミドルウェアを統合および開発します GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆☆
07 データ管理、配布、アーキテクチャ設計の基本的なケース GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆☆
08 ビッグデータシリーズ、ストレージ、コンポーネント、コンピューティング、その他のフレームワーク GitHub・ここをクリック GitEE・ここをクリック ☆☆☆☆☆

おすすめ

転載: blog.csdn.net/cicada_smile/article/details/112000428