Spark自体はHadoopに依存しており、HDFSのデータをデータソースとして使用できます。 ただし、MongoSparkコネクタ を使用する場合 Hadoopをまったく経由せずに、MongoDBをSparkのデータソースとして使用できます。