test_schema

unit-testing - MR单元 : Tests fail with custom writable

我正在尝试使用MRUnit为我的hadoop作业实现单元测试.对于我自己的Writable，断言在withOutput(K2k2,V2v2)失败。我已经尝试覆盖Object的equals(Objecto)方法，但这没有帮助。当两个Writable实际上相同时，有什么想法可以告诉MRUnit吗？最佳答案为了使runTest()成功，必须覆盖inthashCode()。关于unit-testing-MR单元:Testsfailwithcustomwritable，我们在StackOve

hadoop - 如何在hbase中搜索像 '%test%'这样的列值

我在co列中保存了大文本内容，我想搜索co列是否包含特定单词，就像我们在中所做的那样RDBMSeg:wherecolike%test%，要实现这个我应该写任何过滤器还是Mapreduce？有人可以举例说明如何实现这一目标吗？最佳答案你可以做类似的事情RegexStringComparatorcomp=newRegexStringComparator(".test.");//or(\W|^)test(\W|$)ifyouwantcompletewordsonly或SubstringComparatorcomp=newSubstri

中搜何在 code section test hadoop hbase

hadoop - 如何使用 Hive 显示 Information Schema？

有什么方法可以使用Hive实现information_schema吗？另外，在Hive中进行数据分析的过程是什么？在SQL中，我们使用Information_Schema的示例如下:SELECT*FROMINFORMATION_SCHEMA.TABLES; 最佳答案 information_schema没有在Hive中实现，有一个openJIRA对于相同的。默认情况下，Hive使用Derby作为Metastore来存储表元数据。通过连接到Derby，可以看到系统表。关于hadoop-如

Information hadoop section code Hive information-schema biginsights

java - SparkOnHBase : NullPointerException during build tests "distributedScan"

我对Hadoop、Spark和HBase还很陌生。我正在尝试构建SparkOnHBasemvncleanpackage(ApacheMaven3.3.3)库但是我在构建过程中遇到了以下失败的测试:-distributedScantotestHBaseclient***FAILED***java.lang.NullPointerException:atorg.apache.hadoop.net.DNS.reverseDns(DNS.java:92)atorg.apache.hadoop.hbase.mapreduce.TableInputFormatBase.reverseDNS(Tab

NullPointerException distributedScan apache section scala java hadoop apache-spark hbase

hadoop - 指向本地文件的 AvroStorage schema_uri 不起作用

我像这样使用AvroStorage:STOREaliasINTO'$OUTPUT'USINGorg.apache.pig.piggybank.storage.avro.AvroStorage('{"index":1,"schema_uri":"file://path/schema.avsc"}');因此，从本地文件系统而不是HDFS获取schema.avsc是明确的。它在伪分布式集群中工作，但在模式文件的java.io.FileNotFoundException的普通集群上失败看起来这是在后端发生的。我假设这是因为AvroStorage在一个节点上的后端调用，与我运行pig脚本的节点不

AvroStorage schema_uri section schema hadoop apache-pig avro

testing - 使用 Hive 进行数据测试

我们的项目要求将数据从源加载到HDFS目标目录。而且我们必须验证数据转换(从源到目标)作为转换规则。他们为我们提供了源表(单个平面文件/表)和目标表的平面文件。我们必须通过Hive进行数据验证我们如何做到这一点，其中是否有任何自动化范围。我对这项Hadoop技术非常陌生。请帮帮我最佳答案尝试以下步骤来验证数据-1-编写自定义UDF并对行应用验证规则，您可以使用REGEX在UDF中编写验证规则。2-编写自定义Serde或InputFOrmat以在加载Hive表时验证数据。3-尝试MapreduceJob直接进行数据验证。如果您的源

testing Hive section validation 自定 hadoop hdfs

hadoop - 如何在 HDP 2.2 中安装 hadoop-examples* 和 hadoop-test* jar？

如何在HortonworksDataPlatform2.2上安装hadoop-examples*和hadoop-test*jar？这些jar在任何服务器上都不存在。我需要安装其他软件包吗？我找到了一个reference也就是说，它们应该位于/usr/share/hadoop，但该目录在我的集群中的任何节点上都不存在。最佳答案对于HDP2.2，大多数内容都移到了/usr/hdp下，所以这些可能就是您要找的内容。[hdpdemo@hdp-demo-mas5hdp]$pwd/usr/hdp[hdpdemo@hdp-demo-mas5h

hadoop 中安 2041 mapreduce hortonworks-data-platform

hadoop - 所需表缺失 : "DBS" in Catalog "" Schema ""

我正在尝试在我的Windows机器上运行Hive。但是，当我尝试从C:\hadoop-2.7.1\hive-2.1.0\bin>hive运行命令时，出现以下错误。Requiredtablemissing:"DBS"inCatalog""Schema"".DataNucleusrequiresthistabletoperformitspersistenceoperations.EitheryourMetaDataisincorrect,oryouneedtoenable"datanucleus.schema.autoCreateTables"org.datanucleus.store.r

amp 34 strong section hadoop hive

hadoop - Pig Schema 错误意外字符 ':'

我正在尝试使用2B:chararray作为一列的名称来创建一个pig模式。它给我一个错误信息2B:chararrayUnexpectedcharacter':'如果删除了该架构，则会创建该架构。这里有什么问题？架构是load'Batting.csv'usingorg.apache.pig.piggybank.storage.CSVExcelStorage(',','YES_MULTILINE','NOCHANGE','SKIP_INPUT_HEADER')as(yearID:int,sting:chararray,teamID:chararray,lgID:chararray,G:ch

amp hadoop chararray section 39 apache-pig

hadoop - org.apache.hadoop.security.AccessControlException : Permission denied: user=test-user, access=EXECUTE, inode ="system":hadoop:test-user:rwx------

以前测试用户曾经驻留在连接丢失的边缘服务器上。因此，我们重建了边缘服务器并一直在尝试启动并运行它，但我一直收到以下错误。Jobinitializationfailed:org.apache.hadoop.security.AccessControlException:org.apache.hadoop.security.AccessControlException:Permissiondenied:user=test-user,access=EXECUTE,inode="system":hadoop:test-user:rwx------atsun.reflect.GeneratedC

hadoop test-user apache java

189 190 191192193 194 195