Dockerイメージをpullした後にbashを起動して色々と手を加える(docker commitを使う)ことはできますが、あまりいい方法ではありません. イメージファイルに手で加える修正が複雑になるともはやどのようにイメージが作られたのかわからなくなり、メンテナビリティが低下してしまいます. 特に、誰かのイメージを拡張して使っている場合、独自にcommitしていると、オリジナルのイメージに入った更新を取り込むには「オリジナルのイメージ再取得 -> 独自に行ったcommitを再度行う」といった操作が必要になってしまいます. そこで、pullしたイメージはDockerfileを更新することによって拡張していくべきです.
Apache Sparkで初めてのアプリケーション作成
Spark のアプリケーション構成の概要と、簡単なアプリケーション作成までをまとめました.