k8s バージョンアップ時のエラーにより Didi システムがクラッシュしましたか?

11月27日夜、滴滴出行のアプリサービスが異常を起こし、システム障害により検索上位に表示され、位置情報の表示やタクシーの配車ができなくなっただけでなく、ドライバーのバックエンドも収益が超過したことが判明した。 690億。滴滴出行は28日と29日、2回の謝罪を発表し、事故の原因は基盤となるシステムソフトウェアの不具合が当初判明したと述べた。

「滴滴出行は従業員を14%削減し、効率を14%向上させた結果、システムがクラッシュした」という一部のネットユーザーのジョークと比較すると、オンライン報道では「K8Sのバージョンアップが間違っており、制御ノードがダウンし、 SRE エンジニアはそれを解決できずに 3 時間を費やしました。」 これが Didi システムの大規模かつ長期にわたる障害の主な理由である可能性があります。業界専門家は、インターネット企業の中核事業における頻繁なダウンタイムや長時間のダウンタイムは、コスト削減や効率向上の副作用の一つであることが多いと指摘した。システムへの投資が不十分で、保守リソースが限られており、プログラマーが頻繁に交代する場合、プログラムの脆弱性が容易に増加します。

過去6四半期に開示された滴滴出行の収益と費用のデータによると、1人当たりの研究開発給与コスト70万~80万元をベンチマークとして使用すると、滴滴出行の研究開発人員は2023年に約1,200人~1,400人減少することになる。したがって、滴滴体制の崩壊には技術的な問題に加え、研究開発費への投資不足や技術人材の継続的な削減などが影響している可能性がある。

写真

おすすめ

転載: blog.csdn.net/LinkSLA/article/details/134727747