データ・カタログ・メタストアの設定
データ・フローは、非構造化データおよび半構造化データのスキーマ定義が格納されるデータ・カタログ・メタストアと統合されています。
テナンシごとに作成できるのは1つのメタストアのみです。この制約により、メタデータの信頼できる唯一の情報源が確保されます。データ・カタログ・メタストアを作成する場合は、オブジェクト・ストレージのmanaged-table-bucket
の場所とexternal-table-bucket
の場所の両方を指定します。これらの2つの場所は、ベスト・プラクティスとして異なるままにしておきます。メタストアは、管理対象表のデータを所有していると想定します。外部表の場合、Hive互換メタストアは基礎となるデータを管理または所有しません。そのため、管理対象表のデータとメタデータの両方をDROPTABLE
を削除するなどの操作では、外部表のメタデータのみが削除されます。
createコマンドおよび必須パラメータを使用して、データ・フローで使用するメタストアを作成します。
oci data-catalog metastore create [OPTIONS]
CLIコマンドのフラグおよび変数オプションの完全なリストは、CLIコマンドライン・リファレンスを参照してください。
CreateMetastore操作を実行して、データ・フローで使用するメタストアを作成します。
データ・カタログ・メタストアでの大まかなアクセス制御
データ・カタログ・メタストアは、Identity and Access Managementサービスを使用して、別のユーザーが作成したリソースへの偶発的なアクセスおよび変更を回避するための、大まかなアクセス制御を提供します。管理者は、メタストア詳細ページの「リソース・リスト」に記載されている事前定義済ポリシーを使用して、カタログ、データベース、表などのリソースへのアクセス権を付与できます。詳細は、データ・カタログ・メタストアのドキュメントを参照してください。
ノート
この機能は、Spark 2.4.4ではサポートされていません。
この機能は、Spark 2.4.4ではサポートされていません。