データの移行は、などの対応方法、コマンド、のために、私は多くの人がすでによく知られていると信じて、DBAの日常の仕事です。成功したデータ移行プロセスは、データベースBへのバックアップ、データベースAからデータを復元するために、だけでなく、データの移行前と後のサービスの完全性、可用性を確保するためだけではなく、言及します。
最近では、顧客へのデータ移行後のスタンドアロンクラスタを行い、オンラインREDOログ・スイッチのクラスタ頻繁に、ログファイルの多くは、少なからず圧力が生じサーバーを作ることが判明しました。この記事では、これらの問題の分析プロセスです。
私たちは、問題を発見しました
1.ログ・アーカイブ頻繁に
移行が完了した後、我々は行わ観察期間の深さをクラスタ化する必要があります。五$ ARCHIVED_LOGビュー、データベースのアーカイブ履歴の分析により、事業活動には、ライブラリーの状況で発見することができます。
変化が明らかであった点の前後で、移行(6月15日)を見つける400倍になるように100回からアーカイブ毎日の頻度を記録することは困難ではない観察の図。移民の交通システムは本当に素晴らしいですので、どちらか、どちらかは、問題のユーザー・プロファイル・データベースに移動します。
2.ビジネスケースが確認され
運用・保守担当者とのコミュニケーションは、多くは新しい移民システムは、システムを使用する人の数を、確認するために、彼らはクラスアクションクエリのものになった後、丸太のような大規模な数を持って来るべきではありません。クラスタ内の他のシステムがありますので、直接新しいシステムの問題を判別できません。O&Mが言っていることを前提とすることは事実である、そして重要な問題は、ログの多数のオペレーティング・ステートメントを生成見つけ、その後、対応するアプリケーションを見つけ、その後、アーカイブの状況は正常であることを確認することです。
分析
トレースされた1。
オンラインREDOログ・スイッチが頻繁に、一般的に起因するのREDOの多くを生成していることを示す、頻繁にアーカイブをログに記録します。AWRによって生成されたREDOケースを確認してください。
その日のログのアーカイブの詳細
ここでは11のクラスタノード2 AWRレポートに6月18日10:00の間で選びます
ノード1:
図は、上で観察された一時間、約リドゥノード3.38メガバイト/ Sの生産速度は、約1時間11.88ギガバイト以内に見ることができます。
ノード2:
观察上图,可以看到在1小时内,节点2的redo的产生速率约为0.26MB/S,那么一小时就有约0.9GB。
通过查询v$archived_log视图,分类计算出10点到11点间所产生的归档日志大小约为12.3GB,这与根据awr报告推算出来的值12.78GB非常接近,可以说明以上两份awr报告的可参考性很高。
2. 顺藤摸瓜
现在已经确认是归档频繁是由大量的redo引起的,那么就需要看在问题时间区间内,导致数据块变化的原因(sql),这个可以从awr报告的“Segments by DB Blocks Changes”部分可以找到答案:
节点1:
节点2:
由上边2个截图可以发现,用户YK***FT名下的有3个表(US***42、US***39、US***06)的数据块被频繁的操作,而这个用户正是新迁入系统的数据库用户。
为了更进一步了解对该3个表做了哪些操作,可以在awr报告中分别搜索表名称,找出相关的sql语句。
由上图可以看出,在1小时之内,对该3个表分别执行了60次update操作,具体的sql语句如下:
这里注意到一个数字60,看样子像是一个定时任务,首先想到的是job。经过查询,发现yk***ft用户下确实存在一个job,而且正好是每分钟执行一次!
进一步查看job执行的存储过程发现正是上边的3条语句:
通过分析US***42、US***39、US***06这个3个表和update中的where语句,发现那3条update语句很有问题,符合where的数据量大,且只增不减,必须要调整。
解决问题
1. 业务情况再确认
根据前边找到的线索,跟运维人员确认job(24)的业务作用,得到的反馈是之前有个需求是定期把符合要求的字段A的值写到字段B,现在该需求已不再需要,可以删除。
2. 调整并观察
禁用job
虽然业务确认可以删除,但为了保险起见,这里将job(24)禁用,通过调用dbms_job.broken完成。
观察redo
这里选择调整之后的6月20日上午10点到11点间集群2节点的awr报告
节点1:
节点2:
AWRは、ビューのノード1及び2における同じ期間に報告され、やり直し発生率が大幅に低減されています。ログファイルを生成する場合を観察することによって、また、アーカイブで見られる頻度を低減します。
改善のためのレビュー
レビューが全体の問題分析を発見し、解決プロセスを実際に見ることができた後、何の技術的な問題は、問題の主な原因は、まだビジネスコミュニケーションにありません。移行前に、既存事業の圧力を含む明確なビジネス管理アプリケーション機能、と確認するのが最善である、データベースオブジェクトの様々な種類のは、あなた不要になった(索引、ビュー、ストアドプロシージャ、関数、トリガ、パフォーマンスのボトルネックを発見しました等)、ウェル対応措置の事前に、データ移行が正常に完了したことを確実にします。