コンソールでの事前トレーニングされたモデルの使用

Visionは、データ・サイエンティストを必要とせずに、イメージからインサイトを抽出するための事前トレーニング済モデルを提供します。

このチュートリアルでは、次の方法を学習します。

開始前

Visionを使用する前に、テナンシ管理者が適切なポリシーを設定する必要があります。

ポリシーの設定

Visionを使用するために必要なポリシーを設定するには、次のステップに従います。

  1. コンソールのナビゲーション・メニューで、「アイデンティティとセキュリティ」を選択します。
  2. 「アイデンティティ」にある「ポリシー」を選択します。
  3. 「ポリシーの作成」を選択します。
    「ポリシーの作成」パネルが表示されます。
  4. 「名前」を入力します英数字、ハイフン、ピリオドおよびアンダースコアのみを使用できます。スペースは使用できません。たとえば、vision-access-policyと入力します。
  5. 「説明」を入力して、他のユーザーにこのポリシー・セットの目的がわかるようにします。たとえば、Policy to access Vision service.と入力します。
  6. 「コンパートメント」を選択します。
  7. 「ポリシー・ビルダー」で、「手動エディタの表示」を選択します。
  8. 次のステートメントを追加します。
    allow any-user to use ai-service-vision-family in tenancy
  9. (オプション)ユーザー・グループへのアクセスのみを制限するには、かわりに次のポリシーを追加します:
    allow group <your-group-name> to use ai-service-vision-family in tenancy
  10. 「作成」を選択します。

1. データ要件の理解

Visionは、様々な形式のイメージ・データと連携して、オブジェクトの検出、イメージへのラベルの割当て、テキストの抽出などを行います。オブジェクト・ストレージを介してデータを受け入れます。Visionがコンソールで実行されている場合は、ローカルに格納されているイメージを指定することもできます。

Visionは、イメージを分析するための同期APIと非同期APIを提供します。次の表に、それぞれのデータ要件を示します。
APIデータ要件
API 内容 サポートされている入力書式
同期API
  • analyzeImage
  • analyzeDocument
個々のイメージを分析します。
  • JPG、PNG。PDFおよびTIFFは、analyzeDocumentでもサポートされています
  • 5MBまで
  • 単一イメージ入力
非同期API 複数のイメージまたは複数ページのPDFを分析します。
  • JPG、PNG。PDFおよびTIFFは、analyzeDocumentでもサポートされています
  • 複数ページのPDFをサポート
  • 最大2,000枚の画像入力

2. オブジェクト・ストレージへのデータのロード

このステップでは、分析するイメージおよびドキュメントをオブジェクト・ストレージにロードします。

1を完了します。この項を試行する前に、データ要件を理解してください

オブジェクト・ストレージ・バケットを作成します

使用できるオブジェクト・ストレージにバケットがすでにある場合は、イメージ・ファイルのロードに関する次の項に進みます。

  1. コンソールのナビゲーション・メニューから、「ストレージ」を選択します。
  2. 「オブジェクト・ストレージ」で、「バケット」を選択します。
  3. 「バケット」ページの「リスト範囲」で、「コンパートメント」を選択します。
  4. 「Create Bucket」を選択します。「バケットの作成」ペインが表示されます。
  5. 「バケット名」を入力します。機密情報を入力しないでください。
  6. 「デフォルトのストレージ層」で、「標準」を選択します。他のフィールドはすべてデフォルト値のままにします。
  7. 「作成」を選択します。

オブジェクト・ストレージ・バケットへのイメージ・ファイルのロード

  1. 「バケット」ページで、イメージをロードするバケットの名前を選択します。バケットの詳細ページが表示されます。
  2. 「リソース」で、「オブジェクト」を選択して、バケット内のオブジェクトのリストを表示します。
  3. 「アップロード」を選択します。「オブジェクトのアップロード」パネルが表示されます。
  4. ロードするファイルをパネルにドラッグするか、「ファイルの選択」を選択してローカル・ファイルから選択します。

3. ドキュメントAI

Visionで文書AI機能を使用するステップ。

2を完了します。この項を試行する前に、データをオブジェクト・ストレージにロードします

Visionコンソールを開く

  1. コンソールのナビゲーション・メニューから、「分析とAI」を選択します。
  2. 「AIサービス」で、「Vision」をクリックします。Visionホーム・ページが表示されます。

ドキュメントAIの使用

  1. 「Vision」で、「Document AI」を選択します。「ドキュメントAI」ページが表示されます。
  2. 「イメージ・ソース」で、「オブジェクト・ストレージ」を選択します。
  3. Select a document that you loaded in 2. Load Data to Object Storage.analyzeDocument APIが呼び出されます。
これらの機能が呼び出され、その結果がコンソールに表示されます。
ドキュメントAIの結果
機能 内容 検索結果
OCR(Optical Character Recognition) イメージからテキスト情報を見つけてデジタル化します。 ドキュメントで識別されたテキストは、「結果」ペインの「RAWテキスト」の下に表示されます。
ドキュメント・イメージ分類 外観、大まかな特徴および抽出されたキーワードに基づいてドキュメントを様々なタイプに分類します。 「ドキュメント・タイプ」への分類が信頼度スコアとともに「結果」ペインに表示されます。
言語分類 ビジュアル機能に基づいてドキュメントの言語を分類します。 信頼度スコアとともに「ドキュメント言語」への分類が「結果」ペインに表示されます。
表抽出 表形式でコンテンツを抽出し、セルの行と列の関係を維持します。 「結果」ペインで、「表」タブをクリックして出力を表示します。
検索可能なPDF出力 PDF形式のドキュメント・イメージの上に透過レイヤーを埋め込んで、キーワードによる検索を可能にします

ノート:この機能は、PDFドキュメントが提供されている場合にのみ使用できます。

「検索可能なPDF」をクリックします。OCR PDFファイルがコンピュータにダウンロードされます。

4. イメージ分析

Visionでイメージ分析機能を使用するステップ。

2を完了します。この項を試行する前に、データをオブジェクト・ストレージにロードします

Visionコンソールを開く

  1. コンソールのナビゲーション・メニューから、「分析とAI」を選択します。
  2. 「AIサービス」で、「Vision」を選択します。Visionホーム・ページが表示されます。

イメージ分類の使用

  1. 「Vision」で、「Image Classification」を選択します。イメージ分類ページが表示されます。
  2. オブジェクト・ストレージを選択します。
  3. Select an image that you loaded in 2. Load Data to Object Storage.analyzeIamge APIが呼び出されます。

イメージ内のオブジェクトを分類した結果は、「結果」セクションに表示されます。検出されたオブジェクトを分類するためのラベルと、各オブジェクトの信頼度スコアがあります。

オブジェクト検出を使用

  1. 「Vision」で、「Object Detection」を選択します。「オブジェクト検出」ページが表示されます。
  2. オブジェクト・ストレージを選択します。
  3. Select an image that you loaded in 2. Load Data to Object Storage.analyzeIamge APIが呼び出されます。

結果は、「結果」セクションに表示されます。検出されたオブジェクト、各オブジェクトの信頼度スコア、および各オブジェクトの周りの強調表示された境界ボックスが「結果」ペインに表示されます。ラベルをクリックすると、そのオブジェクトが検出されたイメージが表示されます。

次の処理

Visionを事前トレーニング済モデルで使用する方法がわかりました。カスタム・モデルで使用してください。