PySparkでログ出力を詳細(DEBUG)にするには、環境変数 SPARK_LOG_LEVEL=DEBUG を設定するだけではなく、Sparkのロガー設定ファイル(log4j.properties)を明示的に読み込ませる必要があります。 ⸻ 方法①:Pythonコード内でログレベルをDEBUGにする(おすすめ) 以下 ...
こんにはYUKIです。 今回は様々な人がビッグデータの世界を簡単に触れられるように分散処理フレームワークであるSparkとPythonを組み合わせたPySparkの環境構築をまとめました。 上から順番に手順をこなしていくことによって、環境構築ができるようになって ...