コンピュート・インスタンス・ヘルス・メトリック

コンピュート仮想マシン(VM)インスタンスのヘルス、容量およびパフォーマンスは、メトリックアラームおよび通知を使用してモニターできます。

このトピックでは、メトリック・ネームスペースoci_compute_instance_healthによって生成されるメトリックについて説明します。

リソース: コンピュートVMインスタンス。

メトリックの概要: oci_compute_instance_health

次のコンピュート・インスタンス・ヘルス・メトリックは、コンピュート・インスタンスのステータス、ヘルスおよびアクセシビリティのモニターに役立ちます。

インスタンス・アクセシビリティ・ステータス: instance_accessibility_statusメトリックを使用すると、VMインスタンスが応答しないかどうかをモニターすることができます。コンピュートでは、アドレス解決プロトコル(ARP)のリクエストがインスタンスの仮想ネットワーク・インタフェース・カード(VNIC)に送信されます。ARP pingが失敗した場合、メトリックはインスタンスが応答していないことを示します。

ノート

instance_accessibility_statusメトリックは、インスタンスの応答性の特定の理由を判別またはレポートしません。ARPテストでは、インスタンスのOSで発生する可能性のある問題についてのインサイトはありません。

インスタンス・ファイル・システムのステータス: instance_file_system_statusメトリックを使用すると、VMインスタンスにファイル・システムの異常の問題があるかどうかをモニターできます。コンピュートは、VMカーネル・ログを分析してボリュームのステータスを確認します。ボリュームが異常ステータスの場合、メトリックは問題のタイプとボリュームを示します。

ノート

instance_file_system_statusメトリックは、インスタンスのファイル・システムの問題またはインスタンスのOSまたはボリュームの問題の特定の理由を判別またはレポートしません。
MQLを使用したinstance_file_system_statusの表示
// The query does not specify the volume type, it can be used for general monitoring purpose of read-only volume issues. Users can get volumeType info by inspecting the "volumeType" dimension of the metrics. 
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY"}.max()
// The queries below specify the volume type, they can be used for specific monitoring purposes
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = BOOT_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = DATA_VOLUME}.max()
InstanceFileSystemStatus[5m]{resourceId = "YOUR-VM-OCID-IN-TENANCY", volumeType = UNKNOWN}.max()
応答しないVMインスタンスのトラブルシューティング
  1. インフラストラクチャ・ヘルス・メトリックを確認して、インフラストラクチャに進行中の問題があるかどうかを判断します。インフラストラクチャに進行中の問題がある場合は、Oracle Cloud Infrastructureによって問題が解決されるまで待機してから、instance_accessibility_statusメトリックを再度確認してください。
  2. インフラストラクチャに進行中の問題がない場合、インスタンスでは、ソフトウェア問題またはネットワークの構成の問題が発生する可能性があり、お客様ご自身で解決が必要になります。OSとネットワークが正しく構成されていることを確認します。コンピュートのトラブルシューティングの提案およびネットワーキングのトラブルシューティングの提案を参照してください。
  3. コンピュートおよびネットワーキングのトラブルシューティングのステップが成功しない場合は、診断リブートを使用すると、アクセスできないインスタンスを再構築できます。

必要なIAMポリシー

リソースをモニターするためには、管理者が作成するポリシーで、コンソールまたはREST APIをSDK、CLIまたはその他のツールとともに使用しているかにかかわらず、必要なアクセスのタイプが許可される必要があります。ポリシーでは、モニタリング・サービスおよびモニター対象のリソースの両方へのアクセス権を付与する必要があります。アクションを実行しようとしたときに、権限がない、または認可されていないというメッセージが表示された場合は、付与されているアクセス権のタイプおよび作業する必要があるコンパートメントを管理者に確認します。モニタリングのユーザー認可の詳細は、IAMポリシーを参照してください。

使用可能なメトリック: oci_compute_instance_health

次の表に示すメトリックが、インスタンスに対して自動的に使用可能になります。これらのメトリックを取得するためにインスタンスでモニタリングを有効にする必要はありません。

また、モニタリング・サービスを使用して、カスタム問合せを作成することもできます。

メトリックには次のディメンションが含まれています:

resourceDisplayName
インスタンスのわかりやすい名前。
resourceId
インスタンスのOCID 
volumeType
問題のあるボリュームのタイプ。値は、BOOT_VOLUME, DATA_VOLUME,およびUNKNOWNです。値がUNKNOWNの場合、問題のあるボリュームのタイプを特定できません。
issueType
ファイル・システムの問題のタイプ。インスタンス・ボリュームがREAD_ONLYモードの場合、値はREAD_ONLYです。
メトリック メトリック表示名 単位 説明 ディメンション
instance_accessibility_status インスタンス・アクセシビリティ・ステータス 件数 VMインスタンスのアクセシビリティ・ステータス。値1は、インフラストラクチャまたはインスタンス自体の問題により、インスタンスの応答がないことを示します。値0は、アクセシビリティの問題が検出されていないことを示します。インスタンスが停止済の場合、メトリックに値はありません。

resourceDisplayName

resourceId

instance_file_system_status インスタンス・ファイル・システムのステータス 件数

VMインスタンスのファイル・システム・ステータス。値1は、インフラストラクチャまたはインスタンス自体が原因で、インスタンスにファイル・システムの問題があることを示します。値0は、ファイル・システムの問題が検出されていないことを示します。

インスタンスが停止済の場合、メトリックに値はありません。

resourceDisplayName

resourceId

volumeType

issueType

コンソールの使用

単一インスタンスのコンピュート・ヘルス・メトリックを表示するには
  1. ナビゲーション・メニューを開き、「コンピュート」を選択します。「コンピュート」で、「インスタンス」を選択します。
  2. 関心のあるインスタンスをクリックします。
  3. 「リソース」で、「メトリック」をクリックします。
  4. 「メトリック・ネームスペース」リストで、「oci_compute_instance_health」を選択します。

    メトリック・ページに、現在のインスタンスのデフォルトのチャート・セットが表示されます。

メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングの概要を参照してください。アラームの通知の詳細は、通知の概要を参照してください。

コンパートメント内のすべてのインスタンスのコンピュート・ヘルス・メトリックを表示するには
  1. ナビゲーション・メニューを開き、「監視および管理」を選択します。「モニタリング」で、「サービス・メトリック」を選択します。
  2. コンパートメントを選択します。
  3. 「メトリック・ネームスペース」で、oci_compute_instance_healthを選択します。

    サービス・メトリック・ページは、選択したメトリック・ネームスペースから出力される各メトリックのチャートを示すように動的に更新されます。

メトリックのモニタリングおよびアラームの使用の詳細は、モニタリングの概要を参照してください。アラームの通知の詳細は、通知の概要を参照してください。