Spark-SubmitおよびCLIの開始
CLIでexecute
文字列を使用しながら、spark-submitを使用してデータ・フローでSparkアプリケーションの実行を開始する際に役立つチュートリアル。
Oracle Cloud Infrastructureデータ・フローの開始の既存のチュートリアルに従いますが、spark-submitコマンドの実行にはCLIを使用します。
開始する前に
CLIを使用してデータ・フローでspark-submitコマンドを使用する前に、いくつかの前提条件を満たし、認証を設定します。
- CLIでspark-submitを使用するための前提条件を満たします。
- CLIでspark-submitを使用するための認証を設定します。
CLIでSpark-submitを使用するための前提条件
CLIでspark-submitを使用するには、次の前提条件を満たします。
- テナンシの設定
- CLIをインストールします。
CLIでSpark-submitを使用するための認証
CLIでspark-submitを使用するための認証を設定します。
CLIでspark-submitを使用するための前提条件が満たされ、CLIがインストールされている場合は、次のコマンドを使用して認証プロファイルを設定します:
$ oci session authenticate
- select the intended region from the provided list of regions.
- Please switch to newly opened browser window to log in!
- Completed browser authentication process!
- Enter the name of the profile you would like to create: <profile_name> ex. oci-cli
- Config written to: ~/.oci/config
- Try out your newly created session credentials with the following example command:
$ oci iam region list --config-file ~/.oci/config --profile <profile_name> --auth security_token
~/.oci/config
ファイルにプロファイルが作成されます。プロファイル名を使用してチュートリアルを実行します。1. Spark-SubmitおよびCLIを使用したJavaアプリケーションの作成
Spark-submitおよびCLIを使用して、チュートリアルを完了します。
2: PySparkを使用した機械学習
Spark-submitおよびCLIを使用して、PySparkで機械学習を実行します。