大規模な着陸クラウドネイティブ、アリクラウドの今後の大ヒットデビューKubeCon中国

6月24日、26から2019まで、KubeConクラウドネイティブコンピュ財団(CNCF)+主催のネイティブクラウド技術会議 CloudNativeCon +オープンソースサミット( 上海上海)、中国間もなく幕ドレス。


中国では2018 KubeCon最初に成功した着陸に続いて、現在のKubeConは、イベントに参加するすべてのプロジェクトやトピックCNCF深さの議論やケーススタディへの参加、プロジェクトの運用・保守に耳を傾け、誰CNCFます世界中から技術者の数千人を引き付けますエンド・ユーザーを共有します。75人の専門家からなるプロジェクト委員会のこのKubeCon + CloudNativeCon +オープンソース首脳会議、見直し案CloudNativeCon KubeCon + 618、およびこのKubeCon中国2019、選択された26本の技術的なプレゼンテーションのAlibabaの合計インチ 


このKubeConでは、アリの雲スマートコンテナプラットフォームは責任が(tert-ブチル同じ)ゆうを生み出している、CNCF TOC、etcdプロジェクトの作者、アリクラウドコンテナプラットフォーム、上級技術専門家の李翔、大使CNCF、Kubernetesプロジェクトのメンテナ、アリ雲の上級技術専門家の張レイそして他の多くのクラウドネイティブ技術大のコーヒーはすべて存在し、技術の共有を行い、そしてそれはあなたのための先進的な両方のオープンソース仮想クラスタ強いマルチテナントデザイン、OpenKruiseオープンソースプロジェクト、オープンクラウドネイティブアプリケーションセンター(クラウドネイティブアプリのハブ)および他の多くのクラウドネイティブをもたらすだろう最新の開発技術の進歩。当社は、通信するか、技術協力を行うために、KubeCon中国とアリコンテナプラットフォームチームにお会いできるのを楽しみにしています。


ラインKubeCon + CloudNativeConアリババ特別ページ


このKuebConスピーチ問題とネイティブ雲の生態成果でアリの雲の包括的な表示
「KubeCon + CloudNativeConアリババ特別ページ**は」正式に開始されています。ここで、あなたは、トラックがカリキュラムのアップデート「CNCFはアリババクラウドネイティブ技術にオープンクラスをx」はKubeConにアリの音声の問題をマスターダイナミックアリクラウドネイティブの製品を理解し、6月24日手のサロンスケジュール、リンクをクリックするか、「読書を終了することができます特別ページにオリジナルの「直接アクセス。

特別ページはリンクされていますhttps://yq.aliyun.com/promotion/833
/>



私たちは、あなたが以下のスピーチに焦点を当てることをお勧めします
**

Kubernetesは時間で、ネイティブの未来を曇らせること

スピーカー
(T付き)コンテナの建物に従事する人々に責任アリインテリジェントなクラウドプラットフォーム

問題について
ネイティブクラウドアプリケーションの実践者として、アリ雲は二から一一の巨大な流れをサポートするだけでなく、大規模な日常業務とアリババの経済を負担するだけでなく。クラウドネイティブの今後の開発動向を見ながら、このプレゼンテーションでは、Kubernetes技術にアリ雲の反射の成功を共有します。

基調講演:アリババ規模のクラウドネイティブ

スピーカー:アリクラウドコンテナプラットフォーム、上級技術専門家の李翔

トピックについて:アリクラウドは、大規模なクラウドネイティブ地面に成功した、このプレゼンテーションは、開発の拡大、信頼性と効率性の側面を含む、あなたの特定の聴衆を与えるために経験を共有移行戦略、および大規模なシーンを探求することを目的に反対していました最適化。(ほとんど)皆のためのアリババ。クラウドネイティブ作品のためのクラウドネイティブな作品。

アリババは、高可用性とスケーラビリティプロメテウスサノスを+


スピーカー
アリクラウドプラットフォームコンテナ上級技術専門家の秦国安(炎症リー)
アリクラウドプラットフォームコンテナシニア開発エンジニア李タオ(呂風)
問題**について
アリババグループKubernetesは、世界最大の電子商取引ビジネスをサポートするために使用されています。可用性とスケーラビリティ、そしてどのように信頼性の高いきめ細かな監視や警告サービスを提供するためには、確かに挑戦です。このプレゼンテーションでは、オープンソースプロジェクトプロメテウス開発サノスに基づいたきめ細かな監視システムの高可用性と拡張性を持つ彼らの経験を共有することになります。システムは、話題が議論される、8億TPSと10Kのリクエストで、アリババクラスタ管理システムをサポートしています。

  • プロメテウスのサポート、大規模なシーンを使用する方法?
  • 複数のインスタンスプロメテウスによって引き起こされる問題を解決するため、データのクエリサノスを使用する方法?
  • 私たちは、このようなターゲットの検出と、レコード管理ルールとアラートルールとして、プロメテウスとサノスの設定から高校の授業に行ってきました。

地域間およびマイクロサービスのクラスタ間でIstio管理を使用します

スピーカー
アリのクラウドプラットフォームコンテナ上級技術専門家の王Xiの寧(トニー・丁)
バックエンド・アーキテクトUniCareer Xiaozhong劉


トピックプロファイル
ポストあなたは、世界中の作業の専門家や学生のニーズを満たすように設計されたプロのeラーニング開発プラットフォームです才能、とのために世界の多くの地域からのユーザーがサービスを提供しています。これらのアプリケーションは、異なる領域の遅延のサービスへのアクセスを減らすために、異なる地域Kubernetesアリクラウド内で複数のクラスタに配備します。効果的にこれらのマイクロのサービスを管理するには、グリッド・サービスは、微細構造を制御するためのマルチクラスタサービストラフィックを必要とし、サービス通信にサービスを保証。


IstioがグリッドKubernertesサービス上に構築され、複数のクラスタKubernetes一元管理を越えたアプリケーションのトラフィックを管理するために複数のトポロジをサポートしています。ケーススタディを通じて、我々は、トラフィック管理の設計と技術のマルチクラスタ展開に関連したグリッド・サービスIstio共有を使用し、課題やニーズと基本となるプラットフォームの制約に応じて、対応する実践のいくつかを説明します。

資源の効率的な利用を実現するために、CPUとGPUの作業負荷主催

スピーカー
アリクラウドプラットフォームコンテナ上級技術専門家は、彼建
金のドレスプラットフォームのデータ技術システムをアリ、テクニカル・エキスパートCenpengハオ(クーパー)が




導入を発行し
、このプレゼンテーションでは、Kubernetes混在クラスタ上でどのようにAIの訓練ミッションと長いサービス部門を記述する。主な目的は、種々の部分を混合することによって達成される。それによって、リソースを節約する、リソースの利用率を向上させるワークロード。私たちは、その上の異なるQoSクラス、cgroup内、スケジューリングなどの寸法、およびから私たちは利用率を評価する方法としてだけでなく、混合部達成方法を説明するだろう。過去数ヶ月にわたって、我々は数百基のノードのGPUとCPUの混合ユニットクラスタを構築し、我々はミキシングと長いサービスAIバッチタスクのクラスタ配置の生産にベストプラクティスを紹介します。

1-5-10:すぐに大規模なコンテナの障害を復元する方法


スピーカー
アリクラウドコンテナプラットフォーム技術の専門家ベアフアン(むしろ謙虚に)


はじめに発行し
、クラウド時代には、手動操作によるコンテナ、ハードウェア障害、血管障害が大幅に増加する可能性の急増に基づくエンタープライズアプリケーションを。そのため、大規模なコンテナの信頼性への投資を増加させることなく、リソースの可用性を確保する方法は、クラウドプラットフォームが直面する大きな課題となっています。alibabaのコンテナ関連の障害1-5-10の再開のために提案された理論を容器の何百万を実行する:1分のMTTD(平均検出時間)、MTTI(平均識別時間)、5分、MTTRを(解像度までの平均時間) 10分。この会議では、我々は1-5-10が、大規模なコンテナの信頼性を向上させる方法について説明します:

  • 1分以内に検出された地域の問題に有効な薬剤を構築する方法。
  • どのようにインテリジェント診断コンテナの問題の専門知識を持ちます。
  • モード自動回収容器の問題主導の故障する方法。

Kubernetesマスターのスケーラビリティとパフォーマンスを学びます

スピーカー
アリクラウドコンテナプラットフォームシニアソフトウェアエンジニア陳Xingyu(ゆうムー)
(スピリットによる)アリクラウド・コンテナ・プラットフォーム上級技術専門家Zengfan歌が


紹介を発行
現在のところ、Kubernetesのサイズ制限は5kのノードであるので、あなたはそう10Kのノードのように管理するためにそれを使用したい場合ウェブクラスタサイズ、あなたが達成することはできません。あなたはKubernetesは5Kノードのパフォーマンスのボトルネックよりも多くを管理するかを知りたいですか?あなたは、新しいレベルに拡張性を拡大したい場合はどのコンポーネント妨げますか?etcd、apiserverまたはスケジューラ?これらの問題を理解することは、大規模な操作Kubernetesクラスタへの鍵です。アリババでは、我々は多くの問題に遭遇し、クラスタが大きくなるなど、ポッドの作成が非常に遅くなります。本発表では、我々はどのように様々なベンチマークと分析を共有したい、とボトルネックを特定するために、どのように制御アセンブリを調整するには、100以上の倍のパフォーマンスを実現しました。

イントロ:containerd


スピーカー
アリクラウドコンテナプラットフォームシニア開発エンジニアフー魏(ゆうソング)
、Googleのソフトウェアエンジニア劉ランタオ


トピックはじめに
このプレゼンテーションでは、のアーキテクチャの設計思想をcontainerdする方法containerdを強化するために、プラグイン機能を使用する観客を共有するために、異なる画像保存と強いを提供します分離液容器操作。同時に、だけでなく、gVisorと観客containerdに示すために、統合された爆竹コンテナランタイムプレゼンテーションの場合、観客にcontainerdを統合するための最良の方法をよりよく理解しましょう。

K8S、カタ裸の金属容器となし、クラウドサーバの構築を使用してアリババ


スピーカー
アリクラウドコンテナプラットフォーム技術の専門家張イーフェイ(ウ・パン)
のシニア開発エンジニア唐Huamin(Huamin)はアリクラウドプラットフォームコンテナ


はじめに発行し
ていないサーバ・コンピューティングは大幅に、導入、管理するために、開発者が減少し、計算の人気の形、実行するアプリケーションですコスト。サーバープラットフォームの非存在下で、異なるサービスのユーザは、典型的には、同じノード上の混合ユニット、マルチテナントシナリオで信頼できる動作環境を提供することが、必要です。アリババでは、我々は、1つの以上のハードの分離およびサービス実行時のパフォーマンスを確保するために、セキュアコンテナ、ストレージ、ネットワーク、ハードウェアおよび他の態様として実行されているカタコンテナを使用しています。この共有では、私たちの生産によると実際には、どのようにシーンランニング高性能マルチ家賃やサービスを実現するのは難しい1以上のために詳細に議論しました。

Alibabaのデジタル探索するオープンソースコミュニティを押します


スピーカー
アリババオープンソースのオフィスマネジメントシニアコミュニティマネージャー趙Shengyu(盛雨が)


はじめに発行し
、オープンソースコミュニティの操作は、特に主要な純粋な開発者コミュニティのために、オープンソースソフトウェアの開発の痛みのポイントとなっている、効果的にオープンソースコミュニティを管理し、方法を見つけますコミュニティに積極的に貢献は、コミュニティ管理の問題で問題を識別するためのデータによって、解決されます。プレゼンテーションが含まれます:

  • コミュニティ内の個々の開発者アクティビティを判断する方法は?
  • オープンソースコミュニティの全体的な活動を判断する方法は?
  • 何がこれらのモデルは、どのような得洞察を、現在分析中の世界でもトップクラスのオープンソースプロジェクトから見ることができますか?
  • オープンソースコミュニティにおけるコミュニティ管理ツールはどのような役割を果たすべき?
  • 以上を踏まえ、どのようなアリ、結果何の収穫をしようか?

**

アリババ:経験と教訓の雲の進化にネイティブの電力供給の巨人

スピーカー
上級技術専門家の張レイアリクラウドプラットフォームコンテナ
コンテナプラットフォームシニア開発エンジニア王西嶼(ワインの願いは)


はじめに発行
クラウドプラットフォームへのグローバルな電子商取引大手アリババのネイティブのように移行するには、このプレゼンテーションでは、容易ではありません、我々は意志我々は昨年の仕事と技術コミュニティ、含むの視点から描く教訓を共有します:

  • 生まれたオリジナルのクラウド技術の移行を指示アリへの主な障害は何ですか?
  • どのようなアリの主な技術的負債?どのように我々はこれらの問題を解決するのですか?我々のアプローチの有効?
  • お使いのアプリケーションの管理と組織Kubernetes完全に異なっている場合、どのようにしますか?
  • なぜ予測可能性は、電子商取引のために不可欠ですか?Kubernetesそのまま使用可能予測可能かどうか?ない場合、その理由は?この問題(可能性がない解決策を)解決する方法は?
  • クラスタ内のノードの数千人のスケーラビリティの問題を検証するには?
  • 大規模チームは、上流社会と連携-Winの勝つことができますか?

イントロ:トンボ

スピーカー
アリクラウドアプリケーションプラットフォームの動作及び技術専門家のメンテナンス胡Zuozheng(正ギリシャ)
アリクラウドアプリケーションプラットフォームの運用・保守シニア開発エンジニア張ジン(あまりにも雲)が


導入を発行し
、より広く、どのように安全かつ効率的にコンテナ業界における技術の応用でイメージを配布エンジニアが直面する新たな挑戦です。トンボプロジェクトは、オープンソースのP2Pインテリジェントな画像や文書配信システムです。プロジェクトには、すべての問題配布ネイティブシーンを曇らせるを解決することを目的とします。現在、トンボプロジェクトは、以下の分野に焦点を当てました:

  • すべての非侵襲的な血管エンジンの、ユーザー指向の明確に定義されたAPI(HTTP):シンプルな
  • 効率的な:P2Pファイルに基づいて帯域幅を節約するためにCDNサポート、流通企業
  • インテリジェンス:ホストの検出レベルは、速度制限のホストを達成するために、インテリジェントなトラフィック制御
  • セキュリティ:データ・ブロック転送の暗号化、HTTPS接続をサポート


本発表では、トンボで、コンテナイメージを配布するに焦点を当てます。私たちは、大規模配信、伝送、セキュリティ、帯域幅のコストを含む組織を、直面している課題を確認し、解決策を提供します。このプレゼンテーションでは、実際の使用例を説明します。

いいえ混乱しない:質量Kubernetes監査院


スピーカー
アリクラウドコンテナプラットフォーム技術の専門家の陳傑
馬Jinjingは金のドレスシニア開発エンジニアアリ


トピックはじめに
我々はすべて知っているように、正確な異常検出と迅速な問題分析は、キーKubernetesクラスタの可用性と安定性を保証することです。しかし、多数のモニタリング指標データと全体Kubernetesプロジェクト、インチ 当店だけのKubernetesクラスタは、一例として、我々はこのような監視データは毎秒数千を生成することを観察しました。どのように合理的なデータや指標のこれらの複雑かつ大量の使用、それらを記録し、効果的に分析され、それが正確な警告情報に視覚的な表示を理解することが容易となり、それは非常に困難な作業です。


本発表では、我々は練習と経験のアリババ、監査および検査面でKubernetesクラスタモニタであなたと共有したいと考えています。まず、我々は安定性に関係Kubernetes重要なデータや指標をチャットだろう、とそれらを理解する方法。我々は統合し、これらのデータや指標の分析方法について話を具体的には、例の形を取ります。最後に、我々は、検査や分析のためのベストプラクティスを自動化するアリババ効率的な、リアルタイムデータを共有します。

GPU Kubernetesの運用コストの深さの調査を最小限に抑えます

スピーカー
張カイアリクラウドプラットフォームコンテナ上級技術専門家
アリクラウドコンテナプラットフォーム技術の専門家の車は、ヤン(必須蘭)は、


はじめに発行
より多くの科学者が学習課題Kubernetes上NvidiaGPUの深さに基づいてデータを実行します。それと同時に、彼らはコストの40%以上のGPUアイドル廃棄物のクラスターを発見しました。それでは、どのように利用GPUでの効率を向上させることができますすることは大きな課題となっています。私たちは、GPU共有ソリューションに基づいてネイティブKubernetesをご紹介します。

  • 共有GPUのAPIを定義する方法
  • スケジューリングGPUベアメタルコード共有のスケジューラを変更しない方法の場合。
  • GPU統合ソリューションとKubernetesを分離する方法
  • また、どのようにデモを通じてKubernetesクラスタのユーザーに同じGPUデバイス上の異なるジョブを実行するだろうTensorflowを示し

ネイティブ加速するクラウド時代の3つの方法が分布をミラーリング


スピーカー
アリクラウドコンテナプラットフォーム技術の専門家江龍(李牙)


はじめに発行
プラクティスや教訓を共有することになります。このプレゼンテーションは、ミラーAlibabaのネットワークサイズの分布の効率を改善することを学びました。シーンに応じて、我々は別の画像配信方法を使用します。分散型P2PベースのCNCF /トンボは、帯域幅や配信時間を短縮するための最も直接的な方法を軽減するために、ミラーの中心です。さらに、リモートストレージミラーリングプログラムでCNCF / containerdリモート・ファイル・システムのスナップショットは、直接、容器エンジンは、ほとんどの時間を配布するために、ネットワークを介して映像コンテンツを読み出します。あなたは、画像コンテンツの読み出し要求に基づいて、トレードオフとして、ローカルストレージからリモートミラーリングにロードされ、その後どのように動的に、第二の方法は、ネットワークの安定性に依存していますか?最後に、私たちは鏡の画像を選択する方法をまとめます。

ポッドは、動的Webクラスターレベルでの資源制約を調整します


スピーカー
アリクラウドコンテナプラットフォーム技術の専門家王チェン
アリクラウドコンテナプラットフォーム技術の専門家のROCKETS(コソース)


を発行はじめに
大規模アリババこのような大規模なグローバル巨大電気のサプライヤーです、彼らが持っているアプリケーションの数やアプリケーションのタイプ。これらのコンテナのためのリソースのどのような科学的かつ合理的な管理、私たちにとって大きな課題となっています。私たちは私たちの実践的な経験と技術の成果を共有するように、この発表では、我々は技術と社会の進化と他の寸法になります。これらは、次のとおりです。

  • コンテナリソース管理コミュニティの現在の状況はどうなっていますか?
  • アリは、このような大規模なアプリケーション展開の具体的な課題は何ですか?
  • 我々のリソース管理上の様々な難病の診断と治療方法を行いますか?
  • 安定したオンラインサービスを確保しながら、どのように我々は大幅にリソースの使用率を向上させるのですか?
  • どのように進化のクラウドベースのネイティブのバランスをとり、迅速な送達を達成するために動作するように?
  • 我々の経験は何をもたらすことができるとどのように我々は、コミュニティからのフィードバックのためのWin-Winの状況を達成するためのお手伝いをすることができますか?




KubeCon中国2019アリババ技術的なプレゼンテーションの概要

**



福利放送


特に、我々はあなたのための準備  50%オフの 2019年6月24-26に上海で開催された購入KubeCon + CloudNativeCon +オープンソースサミット券の割引コード!


Alibabaの懸念パブリッククラウドネイティブ解像度の背景には、「送信優先」すぐにこの割引コードを受け取ります!私たちは上海であなたをお待ちしております!



KubeCon + CloudNativeCon +オープンソースサミットが直接2次元コードをスキャンすることができます購入

おすすめ

転載: yq.aliyun.com/articles/705161