アリのデータ科学者は一度徹底的にデータセットを公表、離れて15 PPTエッセンス、高速ターン!

640?wx_fmt = JPEG

テキスト/技術コミュニティのリーダーシップ

編集/エマ

アリビッグデータと人工知能の科学者の列、アリ、Yunqi議会、データテックおよびその他の総会で共有への羅金鵬共通データプラットフォームのヘッド、:アリの「ダブル・台湾+ ET」デジタル変換の方法論と結果だけでなく、アリ・データ真ん中のOffice製品OneData、OneID、OneService、Dataphinを構築する練習

15 PPTの本質を集中するコンパイルこの記事では、の建設手法アリデータステーションの建設の実践を学ぶために一緒に技術的な大規模なコーヒー、仕事に従ってみましょう、組織セットデータセット、データセットと建設部門などを支援する手順どのような場合に。

01

アリのデータセットのパノラマ

640?wx_fmt = JPEG(画像をクリックすると拡大します)

建築物の組成上のアリ・データ・テーブル、「4つの垂直と水平の3」構造、アリクラウドプラットフォームからの基盤となるインフラストラクチャのプレゼント。

四つの水平このようにアーキテクチャ図、(例えば淘宝、オオヤマネコ、ウマボックスなど)フォーマットアクセスデータに応じてボトムアップ、メインコンテンツデータ取得及びアクセスの底部から、我々は、コンピューティングプラットフォームへデータを抽出します。 OneDataシステムによって構築するフレームワークとして、「事業セグメント分析寸法+」「パブリックデータセンター」。

建設のための上位パブリックデータセンターに基づいて、ビジネスニーズに応じて:消費者データシステム、エンタープライズデータアーキテクチャ、データアーキテクチャおよびその他のコンテンツ。

640?wx_fmt = JPEG

(出典:Yunqiコミュニティ)

深い処理の後、データは財、サービスの価値を再生するために使用することができ、最終的にサービスが「OneService」ミドルウェア統一データを通じて統一されたデータサービスを提供しています。


640?wx_fmt = JPEG

(画像をクリックすると拡大します)

3つの垂直アリババ全体のデータシステムを確保するために、高速、効率的、高品質なデータへのアクセスは、インテリジェントなデータは、各ことを確認するために、床を保護するためのシステムツールと開発プロセスのセットを達成するためのR&Dプラットフォーム、理論と実践を、持っている必要がありますデータシステムを構築するために均一なルールによってチーム、各BU、;ほとんどの当面の問題はコストです後のデータがより多くの、我々はまた、データの品質管理のための統一されたプラットフォームを確立し、同時に、で。


02

アリ「ダブル・台湾」共通の支持「中小受付+アーキテクチャ」

640?wx_fmt = JPEG
アリクラウド、ビッグデータと人工知能の科学者 - インタビューで述べたラインは、台湾のアリは、主側の駅と駅のサービスステーション番号側の敷地内に反映されているダブルを構成し、横並びでは、すべてのフロント業務を取り上げています。

ビジネスユニットは、バックエンドのビジネス変革の前景に使用できる機能を実現するために受信やさしい再利用可能な共有リソースの中核能力を変換し、抽象的な背景リソースをパッケージに統合します。


640?wx_fmt = JPEG

(画像をクリックすると拡大します)

完全な大容量データ記憶装置に流入するデータの背景やビジネスユニットからのデータセットは、製品包装工程を計算する、コアデータ機能は、データのカスタマイズされた革新と事業単位に基づいて連続的なデータ受信のフィードバックに基づいて企業を構成します進化は、強力なサポートを提供します。


640?wx_fmt = JPEG(画像をクリックすると拡大します)

サービスステーションとデータテーブル相補支持強塩基とリア砲兵レーダーアレイとの戦いから構築それぞれ。

03

システムOneDataアリのデータセット

640?wx_fmt = JPEG

OneDataアリは、テーブル内のコアデータである、アリ、公共データプラットフォームのヘッドLuojin鵬が導入された、当社グループは、完全なデータ資産の実現に設計、開発、展開、および使用から標準化と統一された口径データを確実にするためにシステムOneDataデータの共通層を確立しましたリンク管理、標準データ出力。

制服データ標準例えば、同じインデックスUV、データ定義のアリにも10種類の前の内部結束のために、非常に複雑な作業です。報告によると、OneData 30,000人以上のデータ指標の合計に共通のデータ層は、3,000人以上に減少コーミングした後、口径を標準化し、統一されました。

DTの年齢では、データの爆発は、ストレージ、計算コストに大きな課題をもたらしました。羅金鵬によると、統一されたデータ層を構築し、公共の不存在下で導入された、アリ内部サーバの需要は5年後くらいになりましたと100回に到達します。しかし、統一された公共のデータ層を構築した後、相対の5年後のサーバーの需要は90%を保存します。

640?wx_fmt = JPEG

OneDataのアリ・データ・セットの進化機能の三つの段階を経てきた、「形成」ではありません。
最初の段階:完全なアプリケーション主導の時代。この期間中にOracleと同様に同期するソースデータの一次構造は、2つだけのデータアーキテクチャODS + DSS、厳密にのみ実質的ODS層、基本的にはモデルの方法を話します。

第二段階:ビジネス・アリの急速な発展に伴い、データの量も急速に成長して、パフォーマンスがすでに大きな問題で、データの一貫性を向上させる、いくつかの冗長性を排除するためにモデル化し、多数の技術を通じて煙突のような開発モデルを変更したいです、そうアリは、Greenplumはを導入しました。

第三段階:分散コンピューティングストレージプラットフォームで表されるHadoopのための導入、第三世代モデルアーキテクチャ(OneData)、コア層の確立が多次元CDMモデルです。コアコンセプトとしてキンボール次元モデリングの方法論へのモデルを選択しますが、データ・アーキテクチャ・システムを構築するために、いくつかのアップグレードや拡張、アリのグループとなっています。

04

データテーブルPASS層Dataphin


640?wx_fmt = JPEG

(出典:Yunqiコミュニティ)

表モード、全体のデータ、そのようなエンジンのような存在、ダウン倉庫計画の数と、出力テーマサービスからなどのパス層Dataphin製品で。

あなたはDataphinを持っていたら、様々なデータ指先問題が解決することができ、両方の規格は、開発を自動化するために設計されたデータ定義、データモデルは、テーマ別のデータサービスは、オンザフライで生成することを確実にすることができます。

効果的に倉庫の建設障壁の数を削減するだけでなく、生産効率を向上させ、生産コストを削減し、実数値センターになるためにコストセンターから簡単にデータを作成し、定量化、プレゼンテーション、データ資産管理ポータルを提供します。

05

企業のクラウドパワークイックBIデータ分析


640?wx_fmt = JPEG

ビッグデータの管理と完全に構築した後、我々は人々の前でショーの背後にあるデータの値にクイックBIインテリジェンスのデータ視覚化コンポーネントを使用する必要があります。

クイックBIは、状況の特殊な人事データ分析に大きく依存してオリジナルを逆転し、本当の「運転データは」データ生成された値を聞かせてください、フロントライン運用スタッフ・インテリジェンス分析ツールを提供することができます。

今、より多くの企業は、今日の企業の分散ファイルシステムの状態で、その結果、理由は厳しいセキュリティ要件およびローカル自作のデータベースのデータをクラウドに開始し、そして、そのような政府、金融などいくつかの産業。クイックBIしかし、彼らはローカルとクラウドのさまざまなニーズを満たすために、様々なデータソースをリンクすることができ、統一されたデータセットに統合することができます。



06

アリビッグデータコンピテンシーの枠組み

640?wx_fmt = JPEG


迅速なサービスのイノベーションを提供するために、ビジネスの効率を高めるためにアリババ表モードで提示されたデータ、それが生まれた問題を解決することであり、そして統一グローバルデータシステムの実践形成により、低コストを実現するためには、ストレージを計算する数十億ドルを蓄積し、応答時間、固体保証。
グローバルデータ取得及び導入:ガイド、取得、フルサービス、マルチ端末、マルチフォームデータの導入として、データの需要主導型、グローバルイデオロギー多様。
データアーキテクチャと標準開発:統一されたベース層と、共通の中間層は、繁栄データは、構造化と標準化された方法で統一データインジケータインデックス口径を達成するために、アーキテクチャモデルのアプリケーション層を積層しました。
抽出されたデータの奥行き値に接続されている:オブジェクトは、コアビジネスとラベルシステムの中心に形成されているが接続され、深さ値データを抽出しました。
統一データ資産管理:資産分析、アプリケーション、最適化によるメタデータ・センターを構築、カルテットの操作は、データ資産の顔を見るためにデータ値を追跡し、データ管理コストを削減します。
統一テーマサービス:サービスメタデータとデータセンターサービスのクエリエンジンを構築し、統一されたデータの輸出志向型のビジネスロジックとデータクエリにより、複数のデータソースと、複数の物理テーブルを遮蔽します。


640?wx_fmt = JPEG

大幅に豊かにし、改善アリババ大規模なデータセンターを、OneData、OneID、OneServiceダウンフロントラインスタッフのコンセンサス方法論システムに、CEOになるために成熟します。


07

進化の4つの段階でアリのデータセット


640?wx_fmt = JPEG

Alibabaのデータ処理、すなわち、四つの段階を経験してきました:

データベースの段階、主にOLTP(オンライントランザクション処理)の要件。

第二に、   データウェアハウスのステージ、OLAP(オンライン分析処理)がメインの需要になります。

三つの   データプラットフォームステージは、主にBIとレポーティングニーズの技術的な問題を解決するために、

IV。   データは、ステージを設定 OLTP(トランザクション処理)をインタフェースするシステムを介して、およびOLAP(ステートメント分析)は、データサービスの能力を強調する必要があります。


08

建設段階のデータテーブル

640?wx_fmt = JPEG

まず、組織構造のアップグレード。例えば、データの部署やチームのために以前に責任が頻繁に発言権を持たない、ビジネスニーズの顔が無駄にすべてのデータセットのアイデアを作る役割の受動的な受け入れになる傾向があり、許可はデータ・テーブル・チームのために必要とされます。

第二に、変更が動作します。プロジェクトが完了すると、今では多くの企業のデータは、チームの主なタスクは、など、管理、要件管理、プロジェクトされた後、次のプロジェクトにして、スタート需要の責任の下で需要を作り、このような作業は本当に人を訓練します組織、協調ではなく、そのような能力の長さと直線的成長の労働時間を高め、需要とプロジェクト管理経験の増加にもかかわらず、それは時間の経過とともに、専門知識の特定の領域における沈殿物の知識と経験しません時間の経過は、より多くの人々が最初の熱意と創造、人材データサービス、データやモデル、練習終了までの実際には、唯一の綿密な調査を失うことになる、データテーブルを作成するには、最大値であり、可能な継続的なイノベーションを作るために作成、

第三に、変換の役割。だけでなく、ビジネスでデータを操作するための段階的な移行を支援する伝統的な役割からのデータ・テーブル・チームは、ビジネスの人々に追いつくために努力する必要があり、台湾の人々は徐々にビジネスのための発言権を確立するために、単に需要を受け入れません役割、また、このようなデータ駆動型のマーケティングとして、ビジネスのための新たな成長ポイントをもたらすために、合理的な提案を前方に置くことができるようにします。

第四に、エンタープライズ機能のために。あなたは、綿密なビジネスの理解、製品、システム、組織があり、どこ今日理解するために、だけでなく、過去は未来が進化していくか、進化しているかを理解していない場合にのみ、台湾が良いです。台湾だけで良いアーキテクチャ設計を行うために、すべてのものを理解しました。


09

台湾建設方法論でアリ

640?wx_fmt = JPEG

基礎契約の建設で台湾

それは、ビジネスの我々の理解によれば、いくつかの基本的な合意を整理します。例えば、ビジネスは何ですか?ビジネスアイデンティティとは何ですか?境界の様々な事業分野は何ですか?これらの領域のそれぞれは、それが基本的なサービスを提供するためには何?これらのアイデアのさらなる指針は基準や経営管理と管理基準のビジネスプラットフォームの実装を確立し続けています。

台湾のインフラストラクチャ:集中制御ユニット

ビジネスをマッピングする機能は、構造体、グローバルビジネスのアイデンティティ、ビジネスパノラマ、ビジネス指標、などを必要とし、主にプロトコルの標準によって分解されるオペレーティング・プラットフォームです。これは、詳細を制御するために、私たちは大きな絵を見るための場所を持つことができます。


10

アリ台湾:組織は、テーブル内のデータを確保することです

640?wx_fmt = JPEG

アダム・スミスは「国富論」を発行し、同時に、ワットが蒸気機関を改善し、労働の理論とあいおいの社会的な部門は産業革命、人類の文明の歴史は消えないマークを書いた同行しました。

軍事組織に重点を置いて、階層(官僚)があるので、ということにもアームとして、大規模および産業年齢の効率的な生産を強調するために、組織の核となる産業文明の根底にあるロジックと一緒に官僚のピラミッド、効率的な組織構造に強い実行を取得するには、トップダウンのコマンドを保証します。

インターネット時代の到来により、消費者の需要が素晴らしいリリースであり、工業化時代の大量生産は、挑戦「マスカスタマイゼーション」本番モード変換になってきた、伝統的な官僚は大規模に構築されています生産に基づいて、したがってアドホックモード変換、自己組織フラットへの移行に面します。

本当の難しさは、多くの場合、意図的にまたは意図せずに回避皆の者で組織上の駅ビルの再建です。

台湾の戦略の成功は、マッチング技術アーキテクチャと組織構造を達成することができ、それは過去の周りではありませんが、しきい値を交差させなければなりません。設立課、ハイアール1つの1、パラレル機能、最近の組織構造テンセントを再構築するための努力、我々はこの点で作られたこれらの企業を懸念しているからアリのシェア。


11
キーポイントの記事まとめ

1、アリは、データテーブルをPANORAMA建築物の組成上のアリ・データ・テーブル、「4つの垂直と水平の3」構造、アリクラウドプラットフォームからの基盤となるインフラストラクチャのプレゼント。
2、アリ「ダブル・台湾」共通の支持「中小台湾+フロント」アーキテクチャサービスステーションとデータテーブル相補支持強塩基とリア砲兵レーダーアレイとの戦いから構築それぞれ。
3、アリのデータセットOneDataシステム当社グループは、データ標準データ出力を提供し、標準化と統合データ保護口径の設計、開発、展開、および使用から、資産データリンク管理の完全な実現をOneDataシステムの共通層を確立します。
図4に示すように、データ・テーブル・パス層Dataphinそのようなエンジンのような存在、ダウン倉庫計画の数と、出力テーマサービスからなどのパス層Dataphin製品。
5、分析クイックBIヘルプエンタープライズデータ雲それは本当の「動作データ」のデータ生成された値を聞かせてください、フロントライン運用スタッフ・インテリジェンス分析ツールを提供することができます。
6、大規模なデータ容量のためのアリ・フレームワーク台湾のデータは大幅に富化とアリババ大規模なデータセンターを完成、OneData、OneID、OneServiceダウン第一線スタッフコンセンサス方法論のシステムに、CEOになるために成熟します。
7、進化の4段階のアリ・データ・セットデータベース、データウェアハウス、データプラットフォーム、局データ。
図8に示すように、ステップ・データ・テーブルの構造組織構造のアップグレード、エンタープライズ機能のために、作業方法に変換する役割を変更します。
9、台湾建設手法でアリ駅ビルと基礎協定、集中制御装置。

10、台湾アリ団体で:台湾の保証におけるデータ編成人間の三柱アリ、公益事業のアップグレード省の組織構造。

最近のホットテキストをお勧めします:

1.アリ、台湾で一度徹底的に公表アーキテクチャでのアーキテクチャのディレクター、13ページPPT詳細エッセンス、提案のコレクション!

2. ステーション建設の方法論:台湾での研究・アリは、我々は最も貴重な部分を学ばなければなりません!


ベストセラー書籍「技術経営サミット」作者黄Zhekeng、CSDN・カレッジに参加するには、「技術的リーダーシップコミュニティ」には、慎重に研磨半年後、立ち上げた「技術的な人々に管理部20のストレス与える」のコースを、このコースを詳細に説明することを望み、あなたはすぐに「技術経営」機能は、経営の知識を強化するためにマップする確立することができ、技術革新者のキャリア開発のボトルネックはあなたの職場の技術管理の新しい章を開きました

640?wx_fmt = PNG

このコースはに基づいている中国の文化「国政」と組み合わせるイデオロギーエッセンス、西洋経営理念、提案:「3つの軸」の経営実践Zhengxintai、Xiuji、ダレン「ハート」と「移動」から、助けに人々が経営の本質を理解しています。

最初の100本の読者、唯一の79元の手の価格!

640?wx_fmt = PNG

 -終わり- 

640?wx_fmt = JPEG

著者は、100の大規模なインターネットカフェは、学習の交換したいですか?

「技術的リーダーシップコミュニティ」を追加

押して次のFanger魏コードスキャン、妹エマアシスタントを追加

マーク「プラスグループ」、後に彼女はコミュニティグループにあなたを引っ張ってきます

640?wx_fmt = JPEG


素晴らしいツイート過去:

1. 中年無職男性、40、ディレクター、、、あなたは最終的にまともを残してできるようにしたいと思います

2 台湾での研究アリ最も貴重な:駅の建設方法!

3. 90美しさの最高経営責任者(CEO)は、CTOを見つけたいと思った後、私は彼女にテクニカルマネージャーを与えました

4. 私は、Googleのプログラムに深センの工場元の姉から、10年を過ごしました

5. それのテクニカルディレクターを行います。記述したコード?あなたが書き込みに来ていないのはなぜ

公開された165元の記事 ウォンの賞賛954 ビュー320 000 +

おすすめ

転載: blog.csdn.net/yellowzf3/article/details/100082435