共有への運用・保守の経験:トラブルシューティング方法

さまざまな問題に遭遇し、一年半の運用・保守に従事し、データの損失、馬にリンクされているサイトでは、データベースファイルが誤って問題、ハッカーの攻撃、そして今日のすべての種類はあなたに小さなシェアパートナーを与えるために、整理簡単にしたいと思います削除しました。

まず、オンライン動作仕様

1.テストの使用

先生が実際のマシンとの差はありませんが、ますます上昇実環境への欲求が、仮想マシンのさまざまなスナップショットを可能に私たちに語ったが、仮想マシンがやっている、基本的なサービスからクラスタに、Linuxを使用することを学ばなければなりませんでした唯一のパテ、Iを使用しているため、我々はそのサーバーの操作権限を取得する時間は、試してみたいのを待つことができないことを、私は仕事で初日を覚えて、手の安い習慣のすべての種類を開発し、上司は、私にrootのパスワードを与えました私はsshd_configのすべての再起動のsshdサーバの後、何のテストがないので、とても静かにログインサーバxshell +キーを変更しようと、xshell使用し、またssh接続を残したい、と彼らは、サーバーでブロックされていることが、幸い私がバックアップされたファイル、それを過ぎてエンジンルームの人員CPを聞かせて、幸いこれは小さな会社、または直接行うことが......幸運その後、より良い運です。

2番目の例では、ファイルの同期についてです、我々はすべて迅速にrsyncの同期を知っているが、彼ははるかに高速のrm -rfよりファイルを削除し、rsyncのコマンド内の1つの最初の場合(ファイルの同期ディレクトリの対象となるがありますディレクトリが)、結果は想像することができ、空である私が原因誤用、だけでなく、テストの欠如であったとき、()データとソースディレクトリは、削除されます、彼らは鍵がバックアップされていない、抗ディレクトリを書いた......生産データは、何のバックアップを削除されていない、我々はすべてのそれの結果を求めており、その重要性は自明です。

繰り返し2.Enter前に確認

RM -rf / VARこの間違っについて、私は、高速チップの人々、あるいは比較的遅い速度は、少なくともあなたの心が冷たい半分あなたが実行発見する大きな可能性を、あるときと信じています。

あなたは、私は次の、あなたが注意されていない場合、これらの事故の運転・保守は、他の人にあるとは思わない、あなたが理解すればがある場合、私はちょうど、言いたい、恐れることはありません、誤って何度も出てこなかった、と言うかもしれません1はあなたです。

3.以上操作しないでください

私は運転・保守任意のサーバのrootパスワードを持っているのいくつかを残して、それの典型的な例を挙げ、会社、運用、保守管理にかなり混沌としました。

通常、私たちはときにBaiduのすべての種類、デバッグサーバと顧客サービススーパーバイザー(のlinuxのポイントを理解して)、ネットワーク管理、上司、あなたが助けを他の人に尋ねるが、問題が焼けたときに、操作および保守作業は、あなたが解決できないかどうかを確認するために、簡単なことだろう受信しました、そしてGoogleは、興奮して問題が解決した後、コントロールのさまざまな、完成検索サーバーの設定ファイルつまり、あなたが同じではないとの最後の時間を変更し、バックそれを変更を識別し、他の人はあなたを教え、彼は、解決しましたそして、問題が解決し、誰もが満足している、しかし、あなたはあなただけの修正というファイルに遭遇し、テストが無効である、これで、私は実際には問題の本当の原因であるかわからない、もちろん、これは良いですが......異なるパラメータを変更しますファイルを変更するための時間がそれを変更されていましたか?本当に怒っている、人々は作動しません。

最初のバックアップ操作の後に4

あなたは、このような.confの設定ファイルとして、バックアップ、データを変更したい習慣、設定ファイルを変更する際に加えて、オリジナルのコメントはオプションをお勧めして、コピー、修正。

それに加えて、最初の例であれば、すぐにすべての今、データベースのバックアップ、rsyncの誤用があります。だから、失われたデータベースが一夜にしません、ただバックアップはそんなに苦しまなければならないでしょう。

第二に、データを伴います

1.注意RM -rf

オンライン多くの様々なのrm -rf /、事故のすべての種類のプライマリ・データベース、運用、保守、様々な削除の例としては......小さなミスが大きな損失が発生します。あなたが本当に削除したい場合は、慎重でなければなりません。

何より2.バックアップします

もともとバックアップの様々なに関しては、上記のすべてが、私は再びデータ型を分割し、それを強調したい、バックアップはすごい非常に重要であり、私は私の先生を覚えてデータに関連してどのような言葉は、どんなに注意してもしすぎることはできませんと述べました。私はネット融資プラットフォームは20分ごとに一度バックアップされ、各2時間後に、サードパーティ製の支払いがフルバックアップで、サードパーティ決済会社のウェブサイトやネット貸付プラットフォームの就任式を行う必要があります。私は、我々はすべての裁量それを、言うことはありません。

何よりも3.安定

実際には、だけでなく、全体のサーバー環境でのデータは、最速求めていない、上記のすべて安定しているが、ほとんどの安定性、そして使いやすさのために、そのテストされていない、新しいサーバ・ソフトウェアは、そのようなnginxの+ PHP-FPMとして、生産を使用していない、あります環境PHPああの多様にリンクされ、同様に再起動、またはApache十分に変更します。

すべての上記4.機密

今ポルノの空のすべての種類は、ルータのさまざまなは、それがデータになる、そう言って、ドアをバック飛ぶこと、ない秘密は受け入れられません。

第三に、安全性に関連します

  1. SSH

(あなたが黒に専門的である場合に、スキャンの下に出てきた、もちろん)、デフォルトのポートを変更して
rootログインを禁止し
、通常のユーザー認証+キー+ sudoのルール+ IPアドレス+ユーザー制限として
さらにいくつかの試みが直接引っ張るよりも、ソフトウェアを(割れhostdenyで同様の爆発の使用を黒)
ログインユーザでスクリーニング/ etc / passwdファイル
2.ファイアウォール

ファイアウォールは、本番環境を開く必要があり、最小の原則に従うべきである、すべてをドロップし、必要なサービスのポートを開放します。

3.細かい粒度と制御権限

通常のユーザがroot、最小限にサービスのアクセス制御を使用しないように決定されたサービスの使用を開始することができ、制御の細かい粒度でなければなりません。

4.侵入検知、およびログ監視

サードパーティ製のソフトウェアを使用して、このよう、/ etc / passwdファイルは、/ etcなどの様々なサービスの時間変化検出システムの重要なファイルや設定ファイル、 / my.cnfファイルは、/ etc / httpdの/ CON / httpd.con など、
使用がログを一元管理システム、監視は/ var / log /確保、/監視など/ログ/メッセージ、FTP アップロードとダウンロードファイル、およびアラームので、エラーログ、
ポートスキャンのために別のものを、あなたには、いくつかのサードパーティ製のソフトウェアを使用することができ、我々は描画host.denyに直接スキャンすることが判明しました。侵略のトラブルシューティングのヘルプのための情報システム。これは、セキュリティで企業の投資のコストは、彼が失われたセキュリティ攻撃のコストと正比例している、と言われてきた、セキュリティが大きな話題ですが、また非常に基本的な、基礎がよく、かなりの増加システムのセキュリティ可能性別、その他には、セキュリティの専門家を行うことです。

第四に、日々のモニタリング

1.操作監視システム

運用・保守に多くの人々が最初から監視され、大企業は一般的に、プロの24時間監視運用・保守を持っています。運用監視システムは、一般的に、ハードウェアの使用率、共通、メモリ、ハードディスク、CPU、カード、監視のログイン、システム上重要なファイル監視などのOSを含み、定期的なモニタリングは、ハードウェアの損傷の確率を予測することができ、非常に実用的なチューニングをもたらします機能。

2.運用監視サービス

一般に、監視サービスは、一般的な指標を監視しているアプリケーション、ウェブ、DB、LVS、等の様々な、である、迅速に特定およびシステムである場合に解決のパフォーマンスのボトルネックが発生することができるであろう。

3.ログ監視

ここでは、セキュリティログ監視で監視同様のログがありますが、ここでは一般的に、ハードウェア、OS、アプリケーションエラーやアラーム情報であり、監視するときにシステムの安定性もはるかに良いを行いますが、問題がある場合、あなたは任意の監視をしません、それは非常に受動的になります。

第五に、パフォーマンスチューニング

操作機構の1深い理解

実際には、運用・保守の経験の年以上によると、単に紙の上にチューニングについて話をするが、私はちょうどあなたがより良い理解を持っている場合は、私が更新され、簡単な要約をしたいです。

最適化するためのソフトウェアの前に、例えば、nginxのとApacheなどの、ソフトウェアを実行するためのメカニズムを理解するために、nginxの誰もが、それは、どのくらいの速nginxの、使用何原則を知っている必要がありますapacheのよりリクエストを処理するために、そして他の人に話をすぐに言います言葉を理解するのは簡単で出て、必要なときだけでなく、ソースコードを読むことができる、または他のパラメータチューニングオブジェクトによって文書内の話に盲目です。

2.チューニングFrameworkとあり

基礎となる操作機構に泊まったが、このようなデータベースのボトルネックとしてチューニング枠組みと秩序、そこにあるべき、多くの人々は、データベース用の設定ファイルを変更するために直接行く、私の提案は、ボトルネック分析、ビュー・ログ、ライト転送による第一に行くことです優れた方向が、その後、起動して、最後のステップである必要があり、データベース・サーバーのチューニング、最初はハードウェアとオペレーティングシステムである必要があり、データベース・サーバは、現在だけで、すべてのオペレーティング・システム上のさまざまなテストの後にリリースされていません彼が開始する開始する必要があります。

3.各調整するだけつのパラメータ

すべての曲だけで一つのパラメータ、我々はすべて知っている、チューンより、あなた自身が混乱することができ、この比較。

4.ベンチマーク

テストはこのテストの実際のビジネスニーズへのテスト近いが人の経験、関連する情報に依存するかどうか、多くの要因が関与することは、チューニングの便利な側面であるかどうかを確認し、新しいバージョンのソフトウェアなどの安定性とパフォーマンスをテストし、それがベンチマークする必要があります我々は非常に良いですが、「高性能mysqlの」第三版を参照することができます。先生が言ったら、あなたの改善やアップグレードやビジネス環境には万能なパラメータ、任意のパラメータ変更任意のチューニングは非常に、ビジネスシーンと一致していなければならないGoogleにどのようなチューニング、および無長期的な効果はありません。

心の第六に、運用・保守

心の1.コントロール

多くのrm -rf /データは、あなたはあなたの心の制御の下でそれを意図していない、数分前に仕事からある過敏ピークあり、それは過敏が仕事に行って、言われましたが、あなたは時に動揺を回避しようとすることができますキーデータ処理環境。より多くの圧力、より穏やかな、またはあなたはそれ以上失うことになります。

ほとんどの人は、RM -rf /データ/ mysqlの経験を持っていたら、見つけ削除し、あなたが気分のようなものを想像することができますが、バックアップがない場合、あなたは使用が何であるか心配、この場合、一般的には、あなたが沈静化したいと思うでしょうあなたがして、テーブルの、最悪、とMySQLのため、物理的なファイルを削除部分がそうビジネスオフ、メモリに保存されますが、近くに回復し、使用のために有用であるmysqlデータベースは、ハードドライブをコピーするddはありません回復は、もちろん、ほとんどの時間は、あなただけのデータ復旧会社を見つけることができます。

想像して、データが削除され、あなたの様々な操作が、近いデータベース、その後、修理、そこに、ファイルを上書きすることができるだけでなく、メモリ内のテーブルを見つけることができません。

データを担当する2

本番環境では、データベースは子供の遊びではない、子どもの遊びではありませんデータを担当しなければなりません。バックアップの結果は非常に深刻です。

3.下に取得するには

多くの運転・保守要員忙しい、問題はチューブを解決することはできません、私はRenyun魏修理で修復される前に、PHPコードのエラーが発生した後、それは、セッションとwhos_online損傷を発見した昨年のクライアントのウェブサイトは、常にオープンであることを覚えています私はこれを修理していますが、数時間後に、浮上しています。まず、MyISAMテーブルにバグを、第二、のmysqlbugは、MySQLは3分の1が書面である殺すです:3または4回繰り返した後、私はGoogleのデータベーステーブルに不可解なダメージを行ってきました。最後の発見は、OOMは、mysqldプロセスを殺すその結果、十分なメモリではありません。そして、何のスワップパーティションが存在しない、バックグラウンド監視メモリが十分にあり、そして最終的には物理メモリ・ソリューションをアップグレードします。

4.テスト環境と本番環境

あなたは自分のマシンが重要な操作の前に、ウィンドウを開くために回避しようとどこを見ています。

上記の点は、私自身の経験の仕事です、私は不十分、歓迎アドバイスあれば、いくつかの助けを持って運用・保守要員の一部を与えることを願っています。

投稿者:のhttp://os.51cto.com/art/201404/434770.htm

リリース元の2件の記事 ウォンの賞賛0 ビュー252

おすすめ

転載: blog.csdn.net/xiaohuangren_123/article/details/105082953