JDBCRDD_草庐IT

ApacheSparkJDBCRDD是否使用HDFS来存储数据库记录并将其分发到工作节点？我们正在使用JdbcRDD与apachespark上的数据库进行交互。我们想知道ApacheSpark是使用HDFS来分发和存储数据库表记录还是工作节点直接与数据库交互。最佳答案 JdbcRDD不使用HDFS，直接从JDBC连接读取数据到worker内存中的RDD。如果您想要HDFS上的结果，您必须明确地将RDD持久化到HDFS。你可以在这里看到JdbcRDD是如何运作的https://github.com/apache/spark/blob