昼夜を問わずSQLServerアラートへの応答を担当するデータベース管理者にとって、何かが注意を必要としているという通知の絶え間ない集中砲火によって、過負荷の感覚が悪化する可能性があります。右。今。
SQL Serverの監視は、システムの高可用性を維持し、パフォーマンスの問題を追跡するために不可欠です。アラートは、問題があることを見つけるための最も効率的な方法です。しかし、良いことをやりすぎる可能性があります。
ことわざにあるように、「すべてが優先されるとき、何も優先されません。」アラートの疲労は現実のものであり、ユーザーに悪影響を及ぼしているイベントを無視または却下する可能性があります。
SQL Serverのパフォーマンス監視を設定するときは、通知を受け取るタイミング、理由、頻度を制御する方法で、注意深くアラームを構成することが重要です。アラートの過負荷を軽減し、正気の残りを保存するのに役立つアラートを管理する4つの方法を次に示します。
1。不要なアラームをオフにする
多くのDBAにとって、これは口で言うほど簡単ではありません。受信しないアラートを選択することを考えると、恐怖の小さな要素があります。幸い、FOMOの負担を少し軽減するために実装できるベストプラクティスがいくつかあります。
実行できる最も簡単な方法の1つは、アラートログを確認し、慢性的な誤警報または誤検知であるアラートを遮断することです。実際の問題を見逃さない可能性が高く、不必要な通知への対応からの脱却を脳は高く評価します。
もう1つの戦略は、Googleのサイト信頼性エンジニア(SRE)によるものです。 SREは、可用性、遅延、パフォーマンス、効率、変更管理、監視、緊急対応、および容量計画を担当します。
SREチームは、アラート/チケット/ログシステムを導入して、人間の介入が必要な速度に基づいてイベントに応答を割り当てることにより、アラートの過負荷を最小限に抑えています。考えられる3つの応答は次のとおりです。
- アラート:アラートは、人がすぐに行動を起こさなければならない場合にのみ送信されます。
- チケット:イベントに人の対応が必要であるが、通常の営業時間まで待つことができる場合、チケットが送信され、通常のチャネルを通過します。
- ログ:アクションが不要な場合、イベントは診断のためにログに記録されます。
2。スマートアラームを使用して、アラートの根本原因をすばやく特定する
午前3時に通知が表示されて電話が爆発した場合、問題を解決するために1時間ほど時間をかけたくはありません。
スマートアラームは、問題があることを通知するだけでなく、問題を修正して根本原因を特定するのに役立つ方法を提案します。スマートアラームはイベントに関する履歴データも提供するため、アラートがトリガーされる直前と直後に何が起こったかを知ることができます。
3。アラートに優先順位を付けて、最も緊急の問題を特定します
すべてのアラートが同じように作成されるわけではないため、SQL Serverパフォーマンス監視ツールを構成して、最も重要な問題のアラートのみを送信するようにすることが重要です。重大度レベル、ビジネスまたは顧客への影響、および即時のアクションが必要かどうかに基づいてアラートに優先順位を付けることにより、重要ではないアラートによって生成されるノイズの一部を排除します。
サーバーがオフラインになったり、データが大幅に破損したり、重大なデータ損失が発生したりする可能性のある問題(重大度17以上、エラーメッセージ823、824、825など)のアラートの設定に重点を置きます。
4。特定のしきい値とルールを適用してアラームを管理する
しきい値とルールを設定すると、短期間に複数のアラートが発生するのを防ぐことができるため、正気度を大幅に節約できます。
パフォーマンスのしきい値を定義すると、SQL Serverは、指定されたメトリックの値が懸念されるレベルに達するまで通知を保留します。たとえば、ディスクの空き領域や物理メモリの空きレベルが危険なほど低くなります。これにより、DBAは、メトリックを常に監視することなく、他のタスクに取り組むことができます。
アラートのルールを設定すると、通知を受け取る頻度などのアクションをカスタマイズできます。たとえば、指定されたアラートが4回トリガーされた場合、またはアラートに特定のデータベースオブジェクトまたはユーザー名が含まれている場合にのみ通知を送信するようにSQLServerを設定できます。
DBAがCOVID-19後の新しい非常に異なるビジネス環境をナビゲートし始めると、ストレスレベルは確実に上昇します。高可用性を維持し、SQL Serverシステムの安全性と最適なパフォーマンスを確保することは、引き続き大きな優先事項です。しかし、今こそSQL Serverの監視機能を利用して、アラート構成を制御し、不要なノイズを取り除く良い機会です。