Spark-SubmitおよびSDKの開始
Java SDKコードを使用し、spark-submitをexecute
文字列とともに使用してデータ・フローでSparkアプリケーションの実行を開始する際に役立つチュートリアル。
SDKを使用してデータ・フローでspark-submitを開始します:Oracle Cloud Infrastructureデータ・フローの開始の既存のチュートリアルに従いますが、spark-submitコマンドの実行にはJava SDKを使用します。
開始する前に
Java SDKを使用してデータ・フローでspark-submitコマンドを使用する前に、前提条件を満たします。
1. Javaを使用したETL
Spark-submitおよびJava SDKを使用して、JavaでETLを実行します。
2: PySparkを使用した機械学習
Spark-submitおよびJava SDKを使用して、PySparkで機械学習を実行します。