データベースサークルのイェランは傲慢で危険です!

著者: ying Haiwen、Oracle ACE、OCM 11g/12c/19c、MySQL 8.0 OCP、Mo Tianlun MVP、テクニカル エキスパート、ITPUB コア エキスパート、OCM 講師、NetSilicon DBA ディレクター。

WeChat 公開アカウント:頭が太い魚の水槽

今日、OSCHINA で Xue 長官が招待した記事を見ました。「国内データベースの出現と消滅は技術的な問題ではない」 と彼のコメントとても感動したので記事を書かずにはいられませんでした。

0と1の芸術

さて、コンピュータは、最終的には、ダイオードを使用する技術、つまり、0 と 1 を開閉する技術であり、オペレーティング システム、ソフトウェア、またはその他のものであっても、ハードウェア上で動作し、バイナリを使用することです。本質は依然として数学を扱っています。データベースを例にとると、データベース内のすべてのアルゴリズムは、基本的なバイナリ、ハードウェア ファームウェア、ハードウェア命令セット、ハードウェア ドライバーなどの組み合わせとソフトウェア操作を含む、最も基本的な数学を処理する必要があります。データベースの数学に関連する多くのことはここ数十年進歩していない、だから気軽に追いつくことができるのではないか、とよく言う人がいます。 !

私は高等学校のリベラルアーツカレッジでランドスケープデザインを専攻する DBA です。深い数学レベルからいくつかのことを説明することはできませんが、いくつかの方法で結果を示すことはできます: Anfenfen は Oracle 11g と 19c で同じ構成を使用しています、MySQL 5.6 と 8.0、PG 9 と 16 はまったく同じことを実行し、ハードウェアによってもたらされるいわゆる進歩を平滑化し、パフォーマンスに何らかの改善があるかどうかを確認します (言うまでもなく、それが難しいのはせいぜいです)交代で 4C16GB 仮想マシンをテストします)。

帯域幅のボトルネック

帯域幅のボトルネックというと、常にディスク IO ボトルネックだと言われてきましたが、従来の HDD のパフォーマンスはせいぜい 300MB/秒、数十万 IOPS であり、実際には十分ではありません。しかし、現在の伝送帯域幅はまだかなり厄介な状況にあります。ほとんどのネットワークは主に 10 ギガビットに基づいています。また、現在の主流の PCIe4.0 x4 NVMe SSD シングル ディスクの制限帯域幅は 4000MB に達する可能性があることも前の記事で述べました。/s,つまり、1 台の SSD で 10 ギガビット ネットワーク (1250MB/秒) を完全に占有することができ、メインストリームの 32GBps HBA カードも 1 台の SSD で完全に占有することができます。40GBps IB スイッチは 1 台の SSD をかろうじてサポートでき、100GBps RoCE スイッチはかろうじて 1 台の SSD をサポートできます。 3 つの SSD をサポートします。つまり、マルチチャネルに移行した場合など、つまり、NVMe SSD がますます安価になっている今日では、 を行うと、少数の SSD が 1 台のマシンの帯域幅を占有することもあります。

現在のディスク パフォーマンス > 転送パフォーマンスの時代では、X86 サーバーをベースとした Oracle Exadata の分散ストレージと比較して、専用ストレージ デバイスの方が優れているという声を耳にします。 Oracle Exadataストレージ層は何をしますか?Exadata Storage Softwareは、ハードウェア機能とソフトウェアの組み合わせを最大限に活用して、ストレージ内のデータをフィルタリングし、ネットワーク伝送レベルでの帯域幅要件を削減します。 a >ネットワークをバーストさせる代わりに、NVMe SSD や PMEM などの高性能ディスク デバイスに実際の役割を果たしてもらいます。専用ストレージに関する限り、サーバーを使用することによる伝送ボトルネックを突破することは不可能であり、IO がどれほど強力でエクスポート帯域幅がどれほど大きくても、ストレージ デバイスを使用するサーバーの数を増やすことしかできません。 - 多数の高性能ディスクで構成された単独サーバー、特に分散データベースでのクロスシャード操作に使用されます。データ量が少し大きい限り、ネットワークで処理するのは困難です (ディスクやメモリが原因ではない可能性があります) これが、分散データベースが関連データをシャードに配置することを推奨する理由です (これには、データベース レベルから多くの要件を削除する必要があり、分散データベースを使用して実装できない要件もあります) )。

このセクションの冒頭を振り返ると、なぜ当時は分散されていたのでしょうか? 個人的には、単一のマシンのパフォーマンスでは不十分で、スタックするにはさらに多くのマシンが必要だと考えていますが、現在では、小型 SSD の方が、数十台、数百台よりも全体的な IO パフォーマンスが優れています。次に、分散は再び疑似要件になったのでしょうか? Exadata のソリューションを見てみましょう。ハードウェアの分散ストレージ + 集中データベースを最大限に活用する方が合理的ではないでしょうか?

"はるか先"

いつから始まったのかはわかりませんが、映画「トマトマン」の「しゃがむドラゴンとフェニックスのひよこ」から始まったと思います。かつては褒め言葉だった多くの言葉が、今では軽蔑的な言葉で影を落としています。中には大手企業も含まれており、ある大声で話す人は「はるかに先を行っている」。国内のデータベース通信、宣伝資料 (サブテキストを含む)、および業界情勢の宣伝で、当社の製品の多くが Oracle、DB2、SQLServer、MySQL、PostgreSQL よりはるかに進んでいることを何度も目にしました。これらの外国のデータベース製品 (最後の 2 つになぜこれほど多くのシェルがあるのか​​わかりません)。

前に書いたことに戻りますが、データベースは長い時間をかけて磨き上げる基本的なシステムエンジニアリングであり、いわゆる「高度な概念、高度なアーキテクチャ、高度なアルゴリズム(特にこれらがなければ使用できないもの)」はそれほど多くはありません。それらを実装する方法を知っている).アルゴリズム)」が結合されており、データベース製品は非常に強力になる可能性があります。 !これでは、いわゆる急速な進歩の追いつきしか実現できず、本気で追いつきたいのであれば、基礎を無視しては達成できません。

要約する

データベース界では、ギャップに直面することは恥ではありませんが、傲慢であることは恥であり、いわゆる「はるか先」は最終的にシステムに危険をもたらします。​​    

SenseTime 創設者、Tang Xiaoou 氏が 55 歳で死去 2023 年、PHP は停滞 Wi-Fi 7 が完全に利用可能になる2024 年初頭にデビュー、Wi-Fi 6 の 5 倍高速 Hongmeng システムが独立しつつあり、多くの大学が「Hongmeng クラス」を設立 Zhihui Jun の新興企業が借り換え、金額は 6 億元を超え、事前評価額は 35 億元 Quark Browser PC 版が内部テストを開始 AI コード アシスタントは人気があり、プログラミング言語のランキングはすべてです できることは何もありません Mate 60 Pro の 5G モデムと無線周波数技術ははるかに先を行っています MariaDB が SkySQL を分割し、確立されました独立した企業として<​​/span> Xiaomi、Yu Chengdong 氏の Huawei からの「キールピボット」盗作声明に対応
{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/3859945/blog/10321420