草庐IT

container_storage_type

全部标签

java - 如何在 Flink 中为 Google Cloud Storage 创建 RecoverableWriter

我想使用GoogleCloudStorage使用StreamingFileSink从我的流作业写入(sink)DataStream元素.为此,我使用了GoogleCloudStorageconnector用于Hadoop作为org.apache.hadoop.fs.FileSystem的实现,并使用HadoopFileSystemasanimplementationoforg.apache.flink.core.fs.FileSystem为Flink包装了hadoopFileSystem类。我在我的gradle文件中包含了以下依赖项:编译("com.google.cloud.bigda

hadoop - ESRI Hive ST_Contains 无法正常工作

尝试使用我能找到的JAR(不确定它们是否是最佳选择,我需要使用ESRI并在Hive中执行):ADDJAR/home/user/lib/esri-geometry-api-1.2.1.jar;ADDJAR/home/user/lib/spatial-sdk-hive-1.1.1-SNAPSHOT.jar;ADDJAR/home/user/lib/esri-geometry-api.jar;ADDJAR/home/user/lib/spatial-sdk-hadoop.jar;CREATETEMPORARYFUNCTIONST_PolygonAS'com.esri.hadoop.hive.

hadoop - 克伯罗斯 |云时代 | Krb异常 : Encryption type AES256 CTS mode with HMAC SHA1-96

我一直在尝试为CDH4.5设置Kerberos,这是使用ClouderaManager安装程序设置的。说明来自以下链接:http://www.cloudera.com/content/cloudera-content/cloudera-docs/CM4Ent/4.5.2/Configuring-Hadoop-Security-with-Cloudera-Manager/cmeechs_topic_4.html设置和KDC后,我将Java6文件的JCE策略复制到以下位置:/usr/java/jdk1.6.0_31/lib/security/以下是我的“/var/kerberos/krb5

hadoop - 使用 Pig 加载 Hbase 表。 float 给出 FIELD_DISCARDED_TYPE_CONVERSION_FAILED

我有一个通过HBaseJavaapi加载的HBase表,如下所示:put.add(Bytes.toBytes(HBaseConnection.FAMILY_NAME),Bytes.toBytes("value"),Bytes.toBytes(value));(其中变量value是一个普通的javafloat。)我继续使用Pig加载它,如下所示:raw=LOAD'hbase://tableName'USINGorg.apache.pig.backend.hadoop.hbase.HBaseStorage('family:value','-loadKeytrue-limit5')AS(id

hadoop - MapReduce 与 Hadoop : Type mismatch in key from map

我正在运行一个简单的wordcount程序,但出现以下错误:Typemismatchinkeyfrommap:expectedorg.apache.hadoop.io.Text,receivedorg.apache.hadoop.io.LongWritable这是什么意思,我该如何纠正? 最佳答案 您可以在主函数中使用以下任一行:conf.setMapOutputKeyClass(Text.class);conf.setMapOutputValueClass(IntWritable.class);假设您正在使用JobConfconf

java - Hadoop 错误 : type mismatch in write method

我刚刚编写了一个简单的hadoop程序,我正在尝试使用AES算法加密文本文件。我在我的map方法中一行一行地读取,加密并写入上下文。很简单。我在我的map方法中进行加密并使用行偏移量作为key,所以我不需要reducer类。这是我的代码:publicclassEnc{publicstaticclassMapextendsMapper{privateTextword=newText();publicvoidmap(LongWritablekey,Textvalue,Contextcontext)throwsIOException,InterruptedException{Stringst

scala - Spark BigQuery 连接器 : Writing ARRAY type causes exception: ""Invalid value for: ARRAY is not a valid value""

在GoogleCloudDataproc中运行Spark作业。使用BigQueryConnector将作业输出的json数据加载到BigQuery表中。BigQueryStandard-SQLdatatypesdocumentation表示支持ARRAY类型。我的Scala代码是:valoutputDatasetId="mydataset"valtableSchema="["+"{'name':'_id','type':'STRING'},"+"{'name':'array1','type':'ARRAY'},"+"{'name':'array2','type':'ARRAY'},"+

java - 线程 "main"java.lang.VerifyError : Bad type on operand stack 中的异常

此错误已发生在map-reduce程序中,用于在给定的input.txt文件中查找最高温度。我写了两列,分别是年份和温度。Exceptioninthread"main"java.lang.VerifyError:BadtypeonoperandstackExceptionDetails:Location:org/apache/hadoop/mapred/JobTrackerInstrumentation.create(Lorg/apache/hadoop/mapred/JobTracker;Lorg/apache/hadoop/mapred/JobConf;)Lorg/apache/h

java - HDInsight-Spark (spark-submit) 失败 - java.lang.NoSuchMethodError : com. microsoft.azure.storage.blob.CloudBlockBlob.startCopy

我们正在开发一个spark应用程序。它将托管在azureHDInsightSpark集群上。我们的用例是这样的,我们必须从azureblob存储中提取数据并使用spark处理数据,最后创建或将数据追加回azureblob存储。所以我们用了azure-storage-4.3.0.jar我们在eclipse项目中使用了Maven并添加了以下依赖com.microsoft.azureazure-storage4.3.0编译成功。甚至应用程序在本地机器上也能正常运行并且执行时没有任何问题。因此我们从eclipse创建了一个uber/fatjar并移植到我们的AzureHDInsight-Spa

amazon-web-services - 设置 AWS 凭证 - Cloudera Quickstart Docker Container

我正在尝试使用Cloudera的Quickstartdocker容器来测试简单的Hadoop/Hive作业。我希望能够在S3中的数据上运行作业,但到目前为止我遇到了问题。我已将以下属性添加到core-site.xml、hive-site.xml、hdfs-site.xml。fs.s3.awsAccessKeyIdXXXXXXfs.s3.awsSecretAccessKeyXXXXXX无论如何,在Hive中尝试创建指向S3位置的外部表时,我收到错误:FAILED:SemanticExceptionjava.lang.IllegalArgumentException:AWSAccessKe