apache-karaf

java - 从 apache Spark 运行 java 程序时出现 ClassNotFound 异常

我已编译Java程序并尝试使用spark运行，但它显示ClassNotFound异常，即使那里存在类文件也是如此。packageorg.apache.spark.examples;importorg.apache.spark.SparkConf;importorg.apache.spark.api.java.JavaRDD;importorg.apache.spark.api.java.JavaSparkContext;importorg.apache.spark.api.java.function;publicfinalclassJavaHelloWorld{publicstatic

时出 java section apache spark hadoop apache-spark pyspark

hadoop - Apache Spark DataFrame 是否为每次处理从数据库加载数据，或者除非另有说明，否则它是否使用相同的数据？

我们有一个用例，我们需要搜索满足特定条件的特定记录。我们需要识别记录的这些条件有多种。我们计划使用apacheSparkDataframes。ApacheSpark数据帧是否为我们计划执行的每个搜索从db加载表数据，或者它是否在spark集群节点之间加载和分发表数据一次，然后在这些节点上运行搜索条件，直到它被明确告知加载数据来自数据库？最佳答案如果您使用.cache()或.persist()命令创建数据帧，那么它会尝试将数据帧持久保存在内存中。如果您不使用.cache创建它，那么它会按需从源数据集中读取数据。如果没有足够的可用内

另有 DataFrame section Spark 数据 hadoop apache-spark apache-spark-sql

hadoop - Apache Drill 如何在 Hive 之上工作？

ApacheDrill如何在Hive之上工作？它是执行MapReduce来查询，还是类似于Tez的工作方式？谢谢。最佳答案都没有。存储插件将Drill与Hive元数据集成在一起。Drill不会为任何调用Hive执行引擎Drilldocs中所述的请求.您可以使用Drill读取Hive数据，而不是写入。HiveStoragePluginsection有更多信息。关于hadoop-ApacheDrill如何在Hive之上工作？，我们在StackOverflow上找到一个类似的问题：

何在 hadoop section Drill Hive apache-drill

hadoop - 如何在 Hadoop 上的 Apache Pig 中手动构建元组

我有一个文本文件，每一行都是一个字符串，我想从文本文件中的所有字符串构造一个元组。想知道如何在Pig中实现？提前致谢，林最佳答案 @LinMa:如果目标是将每一行都作为Tuple中的一个字段，那么我们可以使用下面的代码片段。输入:line1data....line2data....line3data....lineNdata.....pig脚本:text_data=LOAD'text_data.txt'USINGPigStorage('\n')AS(line_data:chararray);text_data_gpr_all=GR

何在 hadoop data strong section apache-pig

java - MapReduce Apache Hadoop 技术

我正在尝试使用MapReduceHadoop技术对wordcount程序进行统计。我需要做的是开发一个索引字数统计应用程序，该应用程序将计算给定输入文件集中每个文件中每个字词的出现次数。此文件集存在于AmazonS3存储桶中。它还将计算每个单词的总出现次数。我附上了计算给定文件集中单词出现次数的代码。在此之后，我需要打印出哪个文件中出现了哪个单词，以及该特定文件中该单词出现的次数。我知道它有点复杂，但我们将不胜感激。map.javaimportjava.io.IOException;importjava.util.*;importorg.apache.hadoop.io.*;impor

MapReduce Apache IntWritable import java hadoop amazon-s3

hadoop - 错误 TableInputFormat : Java. lang.NullPointerException 在 org.Apache.Hadoop.hbase.TableName.valueOf

我正在尝试使用Spark从HBase读取数据。我正在使用的版本是星火1.3.1和Hbase1.1.1。我收到以下错误ERRORTableInputFormat:java.lang.NullPointerExceptionatorg.apache.hadoop.hbase.TableName.valueOf(TableName.java:417)atorg.apache.hadoop.hbase.client.HTable.(HTable.java:159)atorg.apache.hadoop.hbase.mapreduce.TableInputFormat.setConf(Table

NullPointerException TableInputFormat apache scala org hadoop apache-spark hbase apache-zookeeper hortonworks-data-platform

hadoop - Apache pig 查询加入两个模式

例如，relation1:{a:chararray,b:chararray}(1,abc)(2,asd)relation2:{a:chararray,c:chararray}(1,2.5)(2,4.0)问题是:是否有可能得到与模式的结果关系，如下所示:例如:realtion1中的元组数为2，relation2中的元组数为2。结果关系中的元组数也应仅为2。relation3:{a:chararray,b:chararray,c:chararray}(1,abc,2.5)(2,asd,4.0)谁能帮忙解决一下。最佳答案 joined=

hadoop Apache chararray relation section apache-pig

scala - Spark - SQL : value implicits is not a member of org. apache.spark.sql.SQLContext

您好，请找到下面的代码和相应的错误:即使我使用了导入语句，但仍然出现错误importorg.apache.spark.sql._valsparkConf=newSparkConf().setAppName("new_proj")implicitvalsc=newSparkContext(sparkConf)valsqlContext=neworg.apache.spark.sql.SQLContext(sc)importsqlContext._importsqlContext.implicits._valprojects=sqlContext.read.json("/part-m-00

SQLContext implicits spark 34 apache scala hadoop sbt apache-spark-sql spark-streaming

apache - 扩展自定义 Apache Knox 服务以查询多个 HBase 表

我目前正致力于扩展ApacheKnox与HDP2.3.2上的HBase交互的功能。我在ApacheKnox上创建了一个名为Decode的新网关，用于查询HBase。解码网关是使用HBase网关作为模板构建的。拓扑已被编辑为以下查询:curl-kuadmin:admin-password-H"Accept:application/json"https://sandbox.hortonworks.com:8443/gateway/default/decode/hbase/MyHBaseTable/HBaseRowKey123*将返回第123行的数据(在Base64中)有没有办法改变Deco

自定 apache 34 decode gt hadoop hbase hortonworks-data-platform

python - 在 Apache Hadoop 上扩展 python mrjob 程序

我正在尝试通过Azure在HDInight上运行一个简单的mapreduce程序。我的程序是用python编写的，只是计算有多少行数字(时间序列)满足特定条件。最终结果只是每个类别的计数。我的代码如下所示。frommrjob.jobimportMRJobimportnumpyasnpimporttimeclassMRTimeSeriesFrequencyCount(MRJob):defmapper(self,_,line):series=[float(i)foriinline.split(',')]diff=list(np.diff(series))avg=sum(diff)/len(

python Apache series section time azure hadoop azure-hdinsight mrjob

336 337 338339340 341 342