Yandex が正式にオープンソースのビッグデータ ストレージおよび処理プラットフォーム YTsaurus

ガイド よく知られている理由で、ロシアの開発者はオープン ソースの分野で不当に扱われてきました。それでも、ロシアの大手テクノロジー企業である Yandex は最近、YTsaurus と呼ばれるプロジェクトを GitHub でオープンソース化しました。YTsaurus は、ほとんどの Yandex サービスで使用されているビッグデータを保存および処理するためのプラットフォームです。

Yandex の分散コンピューティング責任者である Maxim Babenko 氏は、次のように述べています。

Yandex は、2010 年から YTsaurus (社内では YT として知られています) を開発しています。すべての要件を満たすことができる単一のソリューションが市場に存在しないため、独自のビッグデータ エコシステムの構築を開始することにしました。現在、YTsaurus は Yandex の内部インフラストラクチャの重要なテクノロジの 1 つです。

公式声明によると、YTsaurus は、データ分析から数十億のパラメーターを持つ複雑なモデルのトレーニングまで、幅広いタスクに適しています。たとえば、Yandex Search はそれを使用して検索インデックスを構築し、自動運転車はそれを使用して大量のデータを処理し、アルゴリズムを改善します。また、YTsaurus は Yandex のスーパーコンピューターを管理し、コンピューティング パワーが可能な限り効率的に使用されるように負荷を分散します。

YTsaurus のプラットフォームの利点は次のとおりです。

  • マルチテナントエコロジー
  • 信頼性と安定性
  • スケーラビリティ
  • 豊富な機能
  • ClickHouseを搭載したCHYT
  • Apache Spark を利用した SPYT

Yandex Cloud の責任者である Alexey Bashkeev 氏は、次のように述べています。

YTsaurus は Yandex 内での実績があり、すべての開発者が利用できるようになりました。負荷が増大し続ける何千ものサーバーで大量のデータを処理する大企業は、最大のメリットを享受できます。YTsaurus をオープンソース化することで、他の製品と同様に、新しいレベルの開発が可能になると考えています。

YTsaurus のソース コードとドキュメントは GitHub で入手でき、プロジェクトは Apache 2.0 ライセンスの下でライセンスされています。Linux の詳細については、https://www.linuxprobe.com/ を確認してください。

 

おすすめ

転載: blog.csdn.net/weixin_56035688/article/details/130076002