データ・アセットの収集

データ・アセットを収集して、データ構造情報をデータ・カタログに抽出し、そのデータ・エンティティおよび属性を表示します。

データ・アセットを収集するには、データ・アセットに対して少なくとも1つの接続を作成している必要があります。

    1. データ・アセットを収集するインスタンスの「ホーム」タブで、「データ・アセット」をクリックします。
    2. 「データ・アセット」ページで、収集するデータ・アセットをクリックします。
    3. データ・アセットの詳細ページで、「収集」をクリックします。
    4. 「接続の選択」セクションで、使用する接続を選択し、「次」をクリックします。
      ノート

      オブジェクト・ストレージ・データ・アセットの場合、「ファイル名パターンの割当て」ボタンを使用して、選択したデータ・アセットにファイル名パターンを割り当てることができます。詳細は、データ・アセットへのファイル名パターンの割当てを参照してください。
    5. 「データ・エンティティの選択」セクションで、データ・エンティティ表から、収集するすべてのデータ・エンティティを表示して追加します。収集ジョブに含める各データ・エンティティの追加アイコンをクリックします。データ・エンティティ・フォルダを展開し、ネストされたデータ・エンティティを表示して含めます。「すべて追加」をクリックして、収集するすべてのエンティティを選択します。使用可能なデータ・エンティティからデータ・エンティティを検索するには、「フォルダ/データ・エンティティのフィルタ」ボックスを使用します。
      ノート

      選択または読取りアクセス権があるフォルダおよびデータ・エンティティのみがリストされます。探しているデータ・エンティティが見つからない場合は、データ・ソース内のそれらのデータ・エンティティへのアクセス権限があることを確認してください。
    6. データ・エンティティ表で、収集するデータ・エンティティを確認します。
    7. (オプション)収集ジョブから削除する選択済データ・エンティティの削除アイコンをクリックします。最初からやりなおす必要がある場合は、「すべて削除」をクリックします。
      ノート

      Oracle DatabaseまたはAutonomous Databaseタイプのデータ・アセットでは、データベース・バージョンがOracle Database 12c以上の場合、データ・カタログ・ハーベスタは、Oracleで保持されているスキーマおよびその他の共通ユーザー・スキーマを収集しません。
    8. 「次へ」をクリックします。
    9. 「ジョブの作成」タブの「ジョブ名」フィールドで、収集ジョブを識別する一意の名前を入力します。
    10. (オプション)「説明」を入力します。
    11. 次にこの収集ジョブを実行する場合、最初の収集ジョブの実行以降に変更されたデータ・エンティティのみ収集するには、「増分収集」チェック・ボックスを選択します。
      ノート

      増分収集は、MySQL、PostgreSQL、HiveおよびKafkaデータ・アセットには適用されません。
    12. 「認識されていないファイルを含める」チェック・ボックスは、データ・カタログでサポートされていないファイルも収集する場合に選択します。たとえば、.log.txt.sh.jar.pdfです。
      ノート

      「認識されないファイルを含む」オプションを選択して、アーカイブ・ファイルのみで構成される論理データ・エンティティを収集します。
    13. Oracle Object Storageデータ・アセットを収集する場合、「一致ファイルのみを含む」チェック・ボックスを選択して、割り当てられたファイル名パターンに一致するファイルのみを収集します。他のファイル名パターンは無視され、スキップされた数に追加されます。
    14. 次のいずれかのオプションを選択して、収集ジョブの実行時間を指定します:
      • 今すぐジョブを実行: 収集ジョブを作成し、ただちに実行します。
      • ジョブの実行をスケジュール: 収集ジョブをスケジュールするための追加のフィールドを表示します。スケジュールの名前と説明を入力します。ジョブの実行頻度を指定します。選択肢は、「hourly」、「daily」、「weekly」、および「monthly」です。ジョブの開始時間と終了時間を選択します。
      • ジョブ構成を後で保存: データ・アセットを収集するジョブを作成しますが、ジョブは実行しません。
    15. 「ジョブの作成」をクリックします。

    「ジョブ」タブで、ジョブのステータスを追跡し、ジョブ詳細を表示できます。

  • createコマンドおよび必須パラメータを使用して、データ・アセットからデータ・エンティティを収集します:

    oci data-catalog job-definition create [OPTIONS]

    CLIコマンドのフラグおよび変数オプションの完全なリストは、CLIコマンドライン・リファレンスを参照してください。

  • CreateJobDefinition操作を実行して、データ・アセットを収集します。