なぜ国内データベース業界ではこれほど並行輸入が多いのでしょうか?

現在、「国産化」の流れの下、国内データベース分野における起業の波はますます高くなっています。 2023 年末の時点で、中国市場には 300 近くのデータベース製品があり、約 100 のデータベース メーカーがあります。セコイア、ヒルハウス、テンセントなどの有名な投資機関はすべて廃業しており、それぞれが少なくとも 3 つの投資データベースを持っており、これは資本の好意を示しています。

一部のデータベースは自らの力で 1 億元の資金調達を獲得し、複数のプロジェクトの入札を勝ち取り、着実に成長し、上場に成功しました。しかし、中には依然として市場から疑問視されているデータベースもあります。国内データベース関連の上場企業16社のうち、黒字企業はほとんどなく、「損して儲かる」モデルがいつまで続くのか疑問に思われる。

それでは、我が国の国内市場は本当にこれほど多くのデータベースメーカーを収容できるのでしょうか?現在のデータベース開発ではどのような問題に直面していますか?最終的に注目を集めるのはどのようなデータベース プレーヤーでしょうか?一般的な中小規模のプロジェクトでは、適切なデータベースをどのように選択すればよいでしょうか?

今回の [オープンソース トーク] では、クラウド ネイティブ データベース ClapDB の創設者である Li Linghui 氏、Tianmou Technology の共同創設者兼 CTO である Qiao Jialin 氏、Infra のエンジニアである Ma Gong 氏を招き、オープンソース データベースにどのような問題があるのか​​について一緒に議論します。今日のデータベース市場はどうなっているでしょうか?

ゲストを共有する:

李玲輝

クラウドネイティブ データベース ClapDB の創設者、Multiplication Cloud の元 CTO、Meiqia の CTO、滴滴出行のチーフ アーキテクト。

新しい時代の分析データサービスを提供するために、クラウドベースのインフラストラクチャの新しいパラダイムに取り組んでいます。

ClapDB は、最新のクラウド ネイティブ テクノロジーの利点を最大限に活用し、クラウド ネイティブ アーキテクチャに基づいてゼロから設計および実装されたデータベースです。 C++ で開発されているため、より高いパフォーマンスが期待でき、あらゆる規模のデータに対して簡単かつ迅速に分析結果を得ることができます。

 

喬佳林

Tianmou Technology、Apache IoTDB PMC の共同創設者兼 CTO、創設メンバー、清華大学の博士号、中国通信協会のオープンソース技術委員会のメンバー、学術書記。

IoT時系列データ管理分野における最初のApacheトップレベルプロジェクトであるIoTDBと、2番目のトップレベルプロジェクトであるTsFileの構築に参加。

彼は Apache メンバー (Apache Foundation のメンバー) であり、中国のオープンソースの先駆者であり、清華大学の水夢奨学生であり、Open Atomic Foundation の銀メダル講師でもあります。基本ソフトウェアの 10 人のリーダーの 1 人です。は、2023 年の優秀ソフトウェア エンジニアを受賞しました。関連する成果は北京科学技術進歩賞の一等賞を受賞した。

Apache IoTDB は、低コストで可用性の高い IoT ネイティブ時系列データベースであり、デバイス、エッジ、クラウドのコラボレーションの軽量構造を採用し、統合された IoT 時系列データの収集、保存、管理、分析をサポートします。

 

ホスト:

馬の労働者

Nordicのインフラエンジニア、公開アカウント「Swedish Horseman」のマネージャー。 「オープンソーストーク」のレギュラーゲスト。

 

01 データベースはたくさんありますが、トレンドを追うことがすべてのせいではありません。

Ma Gong:現在の国内データベース市場は非常に繁栄しており、300 を超えるデータベース製品と 100 を超えるメーカーが存在し、同時に多くの投資が行われ、顧客からも非常に支持されています。しかし現時点では、成功し、国際的な影響力を持っていると考えられる人は多くありません。私たちの巨額の投資と極めて低い生産量は、大きな対照となっています。今日は、このコントラストが形成される理由と、このコントラストを軽減する方法について説明したいと思います。

まずデータベース担当者2人に聞いてみましょう。中国にはすでにデータベースが400あるのに、世界では数十しかないのに、なぜまだデータベースを作っているのですか?

 

Li Linghui:現在、中国にはデータベースを公式に開発している企業が数千社あると思われますが、ある程度有名な企業は 50 ~ 100 社くらいだと思います。私の考えでは、見た目は異なっていても、データベースには 3 つまたは 4 つのタイプがあります。

1 つ目は MySQL のマジック修正に基づいており、2 つ目は PostgreSQL のマジック修正に基づいており、3 つ目は PostgreSQL の Greenplum マジック修正に基づいており、4 つ目は Java の ES または Hadoop エコシステムのパッケージ化に基づいています。 。

問題解決の観点から見ると、オープンソース契約に違反しない限り、オープンソース プロジェクトを再利用することに問題はありません。しかし、ユーザーにとっては、同じように見えるものをそんなにたくさん選ぶ必要はなく、それぞれが違うと言いながら、他のものにない機能を提供する人はいません。

ここで言いたいのは、それぞれが異なるということです。最もよくある答えは、「私はいくつかの革新を行った」ということです。まったくイノベーションがないと言うデータベースベンダーはいないと思いますが、この「少し」は謙虚な言葉かもしれませんし、事実かもしれません。

しかし、ユーザーの視点から見ると、この小さな改善を心から楽しめるユーザーはほとんどいない、または非常に少ないと思います。別のシナリオでは崩壊する可能性があるため、エンジニアリングやテクノロジーに携わる私たちは、特定の条件下で自分の優位性を証明したい場合、基本的にプロジェクトが持っているソフトウェアや種類のものを用意することは不可能であることを知っています。どのような状況でもメリットはありません。

当社の国内競合製品は、データの特性を直接ディスクファイルに記録しているため、最大値を直接取得することができます。それはイノベーションだと言えますか?そうでないとは言えませんが、少なくとも私は他の人がそうしているのを見たことがありません。しかし、それは意味があると思いますか?たまたま最大値が必要な場合にはそれは意味がありますが、フィルタリングなしでデータ ファイル内の最大値と最小値が必要になる人がいるでしょうか?

私たちの最大の違いは、ユーザーの視点からユーザーが何を必要としているかを考えていることです。私たちが解決するユーザーは、クラウドに費やすお金がほとんどないユーザーです。彼らは大企業ではなく、運用と保守の能力がほとんどなく、DBA もいません。さらに、彼らはそれを導入して使用するために何千ページもの複雑なマニュアルを学ぶことができません。それは難しすぎますし、Snowflake は安くありません。しかし、データ分析サービスを利用したいという複雑なデータ分析ニーズを数多く抱えており、私たちはそれらのユーザーのニーズに応え、快適に、安く、楽しく利用できるようにします。

 

Ma Gong:デジタルの観点から見ると、あなたはより安価な Snowflake であり、プロの DBA は必要ありませんが、開発者に直接サービスを提供します。これは確かに違います。なぜなら、私が知っている多くの国内データベースは、独自のデータベースをトレーニングしたい場合に必要だからです。 DBA の皆さん、あなたは私たちのパフォーマンスが彼らのものより優れており、クエリ プラットフォームのスコアが彼らのものよりも高いと感じているかもしれませんが、あなたの考えは実際には異なります。嘉林はどうですか?あなたの研究室にデータベースが必要な理由は何ですか?

 

Qiao Jialin:これら 2 つの質問に答えさせてください。 1 つ目は、なぜ中国にこれほど多くのデータベースがあるのか​​ということです。

まず、データベースが何をするのか見てみましょう。データを管理します。データを管理し、しっかりチェックし、素早くチェックすることは誰もが認識しています。次に、データの種類 (指示されたドキュメント、関係、時系列、キー値、グラフ、ベクトル) が何種類あるかを見てみましょう。データベースをサマライザーとみなすと、実際には、サマライズしたいオブジェクトの種類が非常に多くなります。これに基づいて、適用シナリオはいくつありますか?たとえば、金融が典型的なシナリオであり、モノのインターネットがもう 1 つの典型的なシナリオです。各シナリオでは細分化された業界が存在し、データの使用方法が異なる場合があります。これが、データベースを作成する際に人によって設計コンセプトや目標が異なる理由であり、現在非常に多くのデータベースが存在する大きな理由でもあります。

この文脈では、時系列もデータの種類の 1 つであり、私たちが作成する IoTDB は IoT シナリオの時系列データ管理であることも決定します。この 2 つの点を総合して、この 2 つの点に該当する場合は、当社の製品がより良い選択となります。

では、なぜそのようなデータベースを構築したいのでしょうか?

なぜなら、私たちのグループはデータストレージグループと呼ばれており、企業がデータ管理の効率的な方法を研究するのを支援することに特化しているからです。私たちの研究室自体が産業背景を持つ研究室でもあるため、私たちが接するデータストレージも産業用やIoTのものであり、応用シナリオも最初から決まっています。当初は、オープンソース データベース Cassandra を直接使用して、ビジネスへの適応を行いました。しかしその後、その基礎となるコア設計がユーザーが望んでいたものと完全に一致していないことが判明しました。 Cassandra は柔軟なキーと値のストアに似ています。ユーザーは部分的な逐次操作を備えたデータベースを求めていたため、それに変更を加えようとしましたが、その後、その変更は元のオープンソース プロジェクトと互換性がなく、開発と矛盾してしまいました。カサンドラの目標を達成したので、私たちは独立しました。

 

02 オープンソースもクローズドソースも難しい

Ma Gong:興味深い質問を見つけました。それは、お二人のバックグラウンドがほぼ逆であるということです。 1 つは学術界の出身者です。嘉林氏はお金のことについては決して話しませんでしたし、コストについても話しませんでした。次に、Linghui が業界と当事者 A から来ました。彼は最初からお金のことについて話しました。「クエリには何セントかかりますか?」

あなたの 2 つの戦略は、実際には国内データベースでは異なっており、商用データベースもあれば、オープンソースをベースにしたものもあると思います。長期的に見た場合、それぞれの長所と短所は何だと思いますか?

 

Qiao Jialin:インデックスプレッシャーがあるかどうかは、データベースの選択と設計に大きな影響を与えます。オンライン化に 1 年かかるデータベースと、オンライン化に 3 年かかるデータベースの設計は明らかに異なります。常にプロジェクトのプレッシャーにさらされている場合、すべてのデザインがプロジェクトの優先順位を中心にしている可能性があります。

しかし、最初に学校でそれを始めたときは、そのようなプレッシャーはありませんでした。おそらく、インターネットのシナリオにどのようなデータベースが必要かについてもっと考えたのでしょう。データベース アーキテクチャはどのようなものである必要がありますか?現在、より優れたオープンソース テクノロジーは何ですか?私たちはより多くの選択をし、より多くの技術的ソリューションを実証、設計、実装することができます。その後、Apache Foundation に参加して営利企業になった後、これには、開発者が引き続き貢献できるように、オープン ソース ソフトウェアを使用して開発者をサポートする方法が含まれていました。

現在、エンタープライズ バージョンの一部をオープン ソース データベース製品に基づいて構築していますが、エンタープライズ バージョンをオープンソースにする必要はありません。 GPL 契約と比較して、Apache 契約はソフトウェア開発者の権利と利益の保護を重視しています。まさにこのため、現在、多くのエンタープライズ ソフトウェアが Apache ソフトウェアに基づいてさらに開発されています。したがって、オープンソース ソフトウェアは 1 つの選択肢であり、オープンソース ソフトウェアに基づくエンタープライズ バージョンも別の選択肢です。このエンタープライズ バージョンでは、ユーザーにより多くの技術的保証が提供される可能性があります。

 

Ma Gong: Ling Hui はオープンソース契約にあまり同意していないようですが、それについて説明してみてはいかがでしょうか。

 

Li Linghui:私が本当に不満を抱いているのは、VC の資金や投資家の資金を使って商用のオープンソース会社を設立することです。清華大学がオープンソースにお金を使っているのは当然だと思いますが、オープンソースは社会に還元し、科学研究の成果をオープンにすることです。これは正しいことだと思いますし、学術界が模範を示すべきだと思います。

すべてのオープンソース プロジェクトの半分以上は学術界から来るべきだと私は考えています。多くの最先端の基礎プロジェクトは国家規模の科学研究投資によってのみ達成できます。なぜなら、実験段階は長く、私たちビジネスマンの時間枠は限られているからです。は非常に短いです。会社を経営するということは、学生がお金をもらわずに喜んで科学研究をするようなものではありません。私たち一人ひとりが生きていかなければなりません。企業にとって、これに 10 年も 20 年も費やすことを支持する株主はいません。最初に問題となるのは、どうやってお金を稼ぐかということです。

オープンソースについて言えば、これが革新的なものであり、このような形で市場に売り出されるのであれば、これは正しい方法だと思います。なぜなら、他の人はまだ理解していないかもしれないからです。しかし、私たちのマイクロデータベースのような成熟した市場では、この市場は非常に成熟しており、市場に出ていたものは何十年も市場に出ていません。実際、オープンソースの最大の売りはお金がかからないことですが、お金がかからないあなたの周りの 300 人の兄弟を見て、あなたはどうやって目立つでしょうか?これは誰もが考えたい質問です。ビジネス競争の観点から言えば、私たちが本質的に追求しているのは、人であっても企業であっても、すべてのお金の回収の前提となるのは「かけがえのなさ」です。自分自身のかけがえのなさをどう管理するかは、すべての創業者が考慮しなければならない問題です。

 

03 優れたデータベースには少しのタフさが必要です

Ma Gong: Ling Hui は興味深い質問をしました。B 社は多くのプロジェクトを行っており、それらはカスタマイズされるため、各プロジェクトには独自のバージョンが存在します。 Jialin はオープンソースですが、実際には、製品が他人によってカスタマイズされるのを防ぐ方法はありません。

しかし、実は、甲から見れば、甲もこれを嫌っているのです。私はバージョン管理機能を備えた製品とカスタマイズされたプロジェクトを使用しています。後者はリスクが高すぎます。 A さんはこのバージョンを使いたいとは言いませんでした。この構成を理解できるエンジニアは世界で 2 人だけですよね。しかし、なぜ国内データベース市場はこのようにカスタマイズされた市場を形成したのでしょうか?甲も乙も望んでいなかったのですが、こうなりました。このような異常な状態はなぜ形成されるのでしょうか?

 

李玲輝:私は中国の多くの大きな政党で長い間働いてきました。十分に強力な標準化された製品がなく、ユーザーのニーズが満たされない場合、何をすべきかをユーザーに手伝ってもらう必要があり、ユーザーの想像力は制限されません。彼は全体的な状況については考えず、自分のニーズについてのみ考えます。特に、A が私にこれを言うのが怖いです。「とても簡単なお願いがあります。あなたはこれをやっても構いません...」 この言葉を聞くと、通常、私は逃げ出したくなります。

彼はあなたが理解していないと思っており、あなたに教えたいと思っています。たとえば、あるユーザーは、「あなたの情報が自動的に保存されるのは不安です。ボタンを提供してください。クリックしてください。」と言いました。保存。このボタンには機能がないと言いましたが、実際には保存されています。彼はまだそれが必要だと言いました。

このニーズは満たされるべきだと思いますか?正直に言うと、この需要に応えれば、もっと多くの顧客が「自動的に保存したんじゃないの?」と驚くでしょう。なぜこのボタンを設けたのでしょうか?これは実際にはゲームの問題です。当事者 A と当事者 B がどちらがより権威があり、どちらがこの業界の標準的な答えをよりよく表現できるかを決めるとき、どちらがより厳しいことになるでしょうか。

同じ当事者 A が IBM や Microsoft に会ったとき、彼らはそれほど傲慢ではありませんでした。したがって、あなたが弱い当事者である場合、あなたが受ける尊敬は十分ではありません。

確かに、私たちはプロではないことがあります。あるとき、私のクライアントが私に質問しました。「私はこの業界に 20 年いますが、あなたはこの業界に何年いますか?」 2年間やったって言ってた。彼は、「なぜあなたは私に何をすべきかを教えるのですか?」と言いました。他人の言うことが間違っているとは言えませんが、アート業界には専門分野があります。したがって、ビジネスを始めるとき、特に製品を作るときは、問題を理解する上で自分の能力の範囲を超えることはできないと思います。理解できないことをやっていると、自然とユーザーのニーズに従うようになります。

 

Ma Gong:あなたが指摘した問題は、実際にはデータベースには存在しません。これは他の業界でも同じです。やみくもに顧客のニーズに応えることは、製品を台無しにしてしまいます。これは、プロダクト管理においてよくある誤解です。ユーザーを自分自身のプロダクト マネージャーにしましょう。

もちろん、Ling Hui はすでに説明しました。多くの当事者 B の認知レベルは当事者 A よりも高くないため、当事者 A は当然あなたの言うことを聞きません。私の方があなたより優れていると思うので、お金をあげてお父さんと呼ばせないでくれたら、慈悲深いと思われるでしょう。この強い立場に抵抗できる唯一のことは、あなたが製品を販売するだけでなく、一連のコンセプトと計画を当事者Aに要求し、それを実行することです。計画は良いものであり、私はあなたとそれを検討するつもりです。私たちが対等な関係を築くのが最善です。しかし、ほとんどのプロダクト マネージャーや企業にはこの能力がありません。もしこの能力を持っている人がいるとすれば、その情報源の 1 つは学術界にあると思います。

嘉林氏と同様に、私も清華大学の出身であると言えるでしょう。私たちの研究グループは、10 年以上前から世界中の論文を読んできました。私のほうが20年も働いているからあなたよりも詳しいと思わせるのではなく、新しくてより高度なゲームプレイを業界に導入してもらえませんか?

 

Qiao Jialin:私のメンターが最もよく言ったのは、データベースの複雑さを制御し、データベースが行うべきではないことを行うためにデータベースを使用しないことです。コードの単純さは、データベースの長期的な活力の源です。多くの機能を追加すると、短期的には 1 人か 2 人のユーザーを獲得できるかもしれませんが、長期的にはこのコードは保守できなくなります。

では、なぜこのようなことができるのでしょうか?おそらくこれまでのオープンソースの蓄積によるものだと思います。約 5 年間のオープンソース磨きを経て正式に製品化したため、この製品は基本的にはエンタープライズ ユーザーを含む多くのオープンソース ユーザーのニーズを満たすことができました。この製品は標準的なものなので、ユーザーから変な要望を受けることはありません。ただし、私たちは産業用モノのインターネットのデータベースに取り組んでいるため、産業用シナリオは十分に複雑であり、ビジネス シナリオのニーズについて産業用ユーザーと同等にコミュニケーションしたいと考えており、実際にさらに学ぶ必要があります。

 

さらに多くのライブ コンテンツについては、コードをスキャンしてリプレイをご覧ください↓↓↓


[オープンソーストーク]

OSCHINA ビデオ アカウントのチャット コラム [Open Source Talk] には、毎号技術的なトピックがあり、3 ~ 5 人の専門家が座ってオープンソースについて意見を表明し、チャットします。業界の最新フロンティア、最もホットな技術トピック、最も興味深いオープンソース プロジェクト、最も鋭いイデオロギーの交換をお届けします。新しいアイデアや良いプロジェクトがあり、それを同僚と共有したい場合は、フォーラムはいつでもオープンしていますので、ご連絡ください。

仲間のニワトリがDeepin-IDE を 「オープンソース」化し、ついにブートストラップを達成しました。 いい奴だ、Tencent は本当に Switch を「考える学習機械」に変えた Tencent Cloud の 4 月 8 日の障害レビューと状況説明 RustDesk リモート デスクトップ起動の再構築 Web クライアント WeChat の SQLite ベースのオープンソース ターミナル データベース WCDB がメジャー アップグレードを開始 TIOBE 4 月リスト: PHPは史上最低値に落ち、 FFmpeg の父であるファブリス ベラールはオーディオ圧縮ツール TSAC をリリースし 、Google は大規模なコード モデル CodeGemma をリリースしました 。それはあなたを殺すつもりですか?オープンソースなのでとても優れています - オープンソースの画像およびポスター編集ツール
{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/6852546/blog/11049760