生成AIのメトリック詳細
OCI生成AIリソースは、このサービスで提供されるメトリックを介してモニターできます。OCIモニタリング・サービスを使用して、カスタム問合せおよびアラームを作成し、これらのメトリックがアラーム指定トリガーを満たしたときに通知することもできます。
ホスティング専用AIクラスタ・メトリック
この項では、ホスティング専用AIクラスタのメトリックをリストします。ファインチューニング専用クラスタにはメトリックが表示されません。
メトリック表示名 | 説明 |
---|---|
使用率 | 時間の経過とともに割合として表示される専用AIクラスタの使用可能な容量 |
入力の合計数 | このホスティング専用AIクラスタのモデルが処理した入力トークンの数 |
出力の合計数 | このホスティング専用AIクラスタのモデルが処理した出力トークンの数 |
前述のメトリックは、ホスティング専用AIクラスタの詳細ページから取得できます。
エンドポイント・メトリック
この項では、生成AIのモデル・エンドポイントのメトリックをリストします。
メトリック表示名 | 説明 |
---|---|
合計処理時間 | コール終了までの合計処理時間 |
コール数 | このエンドポイントでホストされているモデルが処理した入力トークンの数 |
サービス・エラー数 | サービス内部エラーのあるコール数 |
クライアント・エラー数 | クライアント側エラーのあるコール数 |
入力の合計数 | このエンドポイントでホストされているモデルが処理した入力トークンの数 |
出力の合計数 | このエンドポイントでホストされているモデルが処理した出力トークンの数 |
コールの成功率 | 成功したコールを合計コール数で割った値 |
前述のメトリックは、エンドポイントの詳細ページから取得できます。
カスタム・クエリーのメトリック
モニタリング・サービスを使用して、生成AIクラスタおよびエンドポイント・メトリックのカスタム問合せおよびアラームを作成できます。
この項では、モニタリング・サービスを使用して生成AIメトリックのカスタム問合せを作成するために使用できるパラメータを示します。
メトリック・パラメータ | 表示名 | 説明 |
---|---|---|
ClientErrorCount |
クライアント・エラー数 | クライアント側エラーのあるコール数 |
InputTokenCount |
入力の合計数 | このリソースでホストされているモデルが処理した入力トークンの数 |
InvocationLatency |
合計処理時間 | このリソースでコールが終了する合計処理時間 |
OutputTokenCount |
出力の合計数 | このリソースでホストされているモデルが処理した出力トークンの数 |
ServerErrorCount |
サービス・エラー数 | サービス内部エラーのあるコール数 |
TotalInvocationCount |
コール数 | コール数 |
これらのカスタム問合せの作成方法のステップは、生成AIメトリックの問合せの作成を参照してください。