評価

AIクイック・アクションによるモデル・パフォーマンスの評価

デプロイ済モデルを使用すると、モデル評価を作成してそのパフォーマンスを評価できます。オブジェクト・ストレージからデータセットを選択するか、作業中のノートブックのストレージからデータセットをアップロードできます。ノートブックからデータセットをアップロードするには、まずノートブック・セッションがファイルをオブジェクト・ストレージに書き込むようにポリシーを設定する必要があります。モデル評価に実験名でラベルを付けることができます。既存の実験から選択するか、新しい実験を作成できます。BERTScore、BLEU Score、Perplexity Score、Text ReadabilityおよびROUGEは、モデル・パフォーマンスの測定に使用できる評価メトリックです。モデル評価結果をオブジェクト・ストレージに保存できます。モデル評価パラメータを設定できます。拡張オプションでは、評価のコンピュート・インスタンス・シェイプを選択し、オプションで停止シーケンスを入力できます。また、モデル評価でロギングを設定して監視することもできます。ロギングはオプションですが、評価によるエラーのトラブルシューティングに役立つことをお薦めします。ロギングを有効にするために必要なポリシーが必要です。ロギングの詳細は、「ログ」の項を参照してください。作成する前に、評価の構成およびパラメータをレビューできます。

「評価」タブに戻ると、モデルの評価が完了すると、評価ライフサイクルの状態がSucceededになります。評価結果を表示し、モデル評価レポートのコピーをローカル・マシンにダウンロードできます。

評価の詳細およびヒントは、GitHubの「評価」を参照してください。

ノート

評価はARMベースのシェイプでは実行できません。

1. 「AIクイック処理」で、「評価」をクリックします。
  「評価」ページが表示されます。
2. 「評価の作成」を選択します。
3. 評価の名前を入力します。
4. モデル・デプロイメント名を選択します。
5. (オプション)評価の説明を入力します。
6. データセットを指定するには、「既存のデータセットの選択」または「ノートブック・ストレージからデータセットをアップロード」を選択します。
7. (オプション)ステップ6で「既存のデータセットの選択」を選択した場合は、コンパートメントを選択します。
8. (オプション)ステップ6で「既存のデータセットの選択」を選択した場合は、データセットのオブジェクト・ストレージの場所を選択します。
9. (オプション)ステップ6で「既存のデータセットの選択」を選択した場合は、オブジェクト・ストレージのパスを指定します。
10. 実験を指定するには、「既存の実験の選択」または「新しい実験の作成」を選択します。実験を使用して、評価のために類似するモデルをグループ化します。
11. オプション: 「既存の実験の選択」を選択した場合は、実験を選択します。
12. オプション: 「新しい実験を作成」を選択した場合:
  
  試験の名前を入力します。
  
  オプション: 実験に説明を付けます。
13. 結果を格納するオブジェクト・ストレージ・バケットを指定します。
  
  コンパートメントの選択
  
  オブジェクト・ストレージの場所を選択します。
  
  オプション: オブジェクト・ストレージ・パスを指定します。
14. 「次」を選択します。
15. (オプション)「パラメータ」で、デフォルト値からモデル評価パラメータを更新します。
16. 「前払オプションの表示」の選択
17. 使用するインスタンスのシェイプおよび停止シーケンスを指定します。
18. (オプション)「ロギング」で、使用するログ・グループおよびログを指定します。
19. 「次」を選択します。
  作成する評価のレビュー・ページが表示されます。
20. 「送信」を選択して評価を開始します。
21. 評価が完了し、「ライフサイクルの状態」が「成功」に設定されたら、評価の横にある矢印をクリックします。
  評価メトリックおよびモデル・パラメータが表示されます。「ダウンロード」を選択して、レポートをHTML形式でダウンロードします。
AIクイック処理CLIコマンドのパラメータおよび値の完全なリストは、AIクイック処理CLIを参照してください。
このタスクはAPIを使用して実行できません。

Oracle Cloud Infrastructureドキュメント

評価