データセットのインポート

データセットをデータ・ラベル付けにインポートするには、このステップに従います。

    1. ナビゲーション・メニューを開き、「アナリティクスとAI」をクリックします。「機械学習」で、「データ・ラベリング」をクリックします。
    2. 「データセット」をクリックします。
    3. 「データのインポート」をクリックします。
    4. 「フォルダのインポート」ページで、ローカル・フォルダをオブジェクト・ストレージにアップロードしてデータセットを作成するか(ステップ5に進む)、またはすでにオブジェクト・ストレージにあるメタデータおよびレコードを取得するか(ステップ6に進む)を指定します。
    5. ファイルをアップロードするには: ローカル・フォルダからオブジェクト・ストレージに、「ローカル・フォルダのアップロード」をクリックし、次のステップを実行します。
      1. 「フォルダの選択」をクリックして、データセット・ファイルを含むファイル・マネージャからフォルダを選択します。
        ノート

        一部の形式では、データセットにメタデータ・ファイルおよびレコード・ファイルが含まれています。レコード・ファイルは、サブフォルダまたはメタデータ・ファイルと同じフォルダにある場合があります。
      2. フォルダを選択し、「アップロード」をクリックします。メタデータ・ファイルへのフォルダ名とパスが検出され、「選択したフォルダ」の下に表示されます。「編集」をクリックしてフォルダの選択を変更し、「削除」をクリックして選択内容を削除します。
      3. Object_Storageの場所で、ローカル・ファイルをロードするオブジェクト・ストレージ・バケットを指定します:
        • オブジェクト・ストレージURL: 読取り専用フィールドはすでに移入されています。
        • コンパートメント: バケットを含むコンパートメントを選択します。
        • ネームスペース: 選択したコンパートメントに基づいて自動的に移入されます。
        • バケット: リストからバケットを選択します。リストが長い場合は、すべてのバケットの表示を選択できます。それをクリックすると、使用可能なすべてのバケットがリストされたパネルが開きます。バケットを作成する必要がある場合は、「バケット」ラベルの横にあるツール・チップ内のリンクをクリックすると、オブジェクト・ストレージ・サービスの「バケット」リスト・ページに移動します。バケットの作成を参照してください。
        • (オプション)接頭辞: ファイルの名前またはパスの先頭に追加する接頭辞文字列を入力します。
      4. 「次へ」をクリックして、ステップ7にスキップします。
    6. すでにオブジェクト・ストレージにあるメタデータとレコードを取得するには、「オブジェクト・ストレージから選択」をクリックし、次のステップに従います:
      1. 「オブジェクト・ストレージの場所」に、ロードするオブジェクト・ストレージのメタデータ・ファイルへのURLをhttps://objectstorage.<region-identifer>.oraclecloud.com/n/<namespace>/b/<bucket>/o/<object>の形式で入力します。このURLは、次のようにバケットの詳細ページで確認できます:
        • ファイルを含むバケットに移動します
        • 「オブジェクト」で、データセット・メタデータ・ファイルを含むフォルダをクリックします。
        • メタデータ・ファイルを検索します。
        • メタデータ・ファイルの「アクション」メニューから、「オブジェクト詳細の表示」を選択します。
        • 「URLパス(URI)」の値をコピーします。
        • オブジェクト・ストレージURLに貼り付けます。
        指定した場合は、「ネームスペース」「バケット」「接頭辞」および「オブジェクト」フィールドがすべてURLから移入されます。
      2. レコード・ファイルがメタデータ・ファイルとは異なるディレクトリにある場合、「ファイルの場所」で、「レコードは同じメタデータ・パスに存在します」チェック・ボックスの選択を解除し、次の情報を指定します。
        • オブジェクト・ストレージURL: 読取り専用フィールドはすでに移入されています。
        • コンパートメント: バケットを含むコンパートメントを選択します。
        • ネームスペース: 選択したコンパートメントに基づいて自動的に移入されます。
        • バケット: リストからバケットを選択します。リストが長い場合は、すべてのバケットの表示を選択できます。それをクリックすると、使用可能なすべてのバケットがリストされたパネルが開きます。
        • (オプション)接頭辞: ファイルの名前またはパスの先頭に追加する接頭辞文字列を入力します。
      3. 次へをクリックします
    7. 「データセット詳細の追加」ページでは、メタデータ・ファイルからフィールドが移入されますが、必要に応じて任意のフィールドに移入できます:
      • 名前: データセットに適切な名前を付けます。
      • 説明: (オプション)データセットの検索に使用できる関連する説明を指定します。
      • ラベル付け手順: (オプション)データにラベル付けするチームの指示および指示を入力します。
      • データセットの形式: イメージ、テキスト、ドキュメントのいずれにラベルを付けるかに応じて、「イメージ」「テキスト」または「ドキュメント」をクリックします。
      • インポート・フォーマット: データセット・フォーマットを選択します。たとえば、COCOまたはYOLO v5です。
      • 注釈クラス: イメージ、テキストまたはドキュメントの注釈付け方法を選択します。
        • 単一ラベル: イメージ、テキストまたはドキュメントを1つのクラスに分類します。
        • 複数ラベル: イメージ、テキストまたはドキュメントを1つ以上のクラスに分類します。
        • オブジェクト検出: イメージのみ。イメージ内のオブジェクトの周囲に境界ボックスを描画します。
        • エンティティ抽出: テキストのみ。テキストを強調表示して1つ以上のクラスにラベル付けします。
        • キー値: ドキュメントの場合のみ。Document Understandingの光学文字認識(OCR)を使用して、ドキュメントから情報を識別して抽出します。
      • ラベル: データセットで使用するラベルを入力します。各ラベルを入力したら、[Return]を押します。
    8. 次へ」をクリックします。
    9. 「Review」ページで、入力した情報を確認します。データセットの詳細を編集する必要がある場合は、「編集」をクリックします。戻って値を変更する必要がある場合は、「編集」をクリックします。
    10. 「インポート」をクリックします。
      レコードは、データセットがインポートされたときに生成されます。データセットの状態は、レコードの生成中にUpdatingに変わります。レコードが作成された後にのみ、使用されるファイルが「データセット詳細」ページに表示されます。
      ノート

      間違った形式を指定した場合、インポートはエラー・メッセージで失敗します。エラー・メッセージで「インポートの再試行」をクリックして、「インポートの再試行」ダイアログ・ボックスを表示します。ここで、必要に応じてメタデータURLまたはインポート・フォーマットを更新し、「再試行」をクリックしてインポートを再試行できます。
    11. リソース・マネージャおよびTerraformを使用して後でデータセットをインポートするには、「スタックとして保存」をクリックして、リソース定義をTerraform構成として保存します。
      リソース定義からのスタックの保存の詳細は、「リソース作成ページからのスタックの作成」を参照してください。
  • データセット・ファイルからデータセットにレコードおよび注釈をインポートするには、import-pre-annotated-dataコマンドおよび必須パラメータを使用します。

    oci data-labeling-service dataset import-pre-annotated [OPTIONS]
    オブジェクト・ストレージのデータセット・ファイルからデータセットにレコードおよび注釈をインポートするには、import-pre-annotated-data-object-storage-import-metadata-pathコマンドおよび必須パラメータを使用します:
    oci data-labeling-service dataset import-pre-annotated-data-object-storage-import-metadata-path [OPTIONS]

    CLIコマンドのフラグおよび変数オプションの完全なリストは、CLIコマンドライン・リファレンスを参照してください。

  • このタスクはAPIでは使用できません。