apache-datafu

java - 带有 datafu : Cannot resolve UDF's 的 apache PIG

我正在尝试从这里开始快速入门:http://datafu.incubator.apache.org/docs/datafu/getting-started.html我几乎尝试了所有方法，但我确定这一定是我的错。我已经试过了:导出PIG_HOME、CLASSPATH、PIG_CLASSPATH使用-cpdatafu-pig-incubating-1.3.0.jar启动pig在本地和hdfs中注册datafu-pig-incubating-1.3.0.jar=>都成功(至少没有显示错误)没有任何帮助在pig身上试试这个:registerdatafu-pig-incubating-1.3.0

java - 使用 java 通过 Apache Ignite 访问 IGFS 文件

我是ApacheIgnite的新手，我需要通过java访问igfs文件。到目前为止，我尝试的是:importjava.io.InputStream;importorg.apache.ignite.Ignite;importorg.apache.ignite.IgniteFileSystem;importorg.apache.ignite.Ignition;importorg.apache.ignite.igfs.IgfsPath;publicclassIgnite_Spark{publicstaticvoidmain(String[]args)throwsException{Ignit

java Apache 34 ignite hadoop

apache - 我正在使用 Hadoop 2.7.2 安装 Hive 2.0.0

我正在尝试使用Hadoop2.7.2安装Hive2.0.0但是我不知道我的执行有什么问题parallels@ubuntu:/usr/local/apache-hive-2.0.0-bin$./bin/hiveSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/local/apache-hive-2.0.0-bin/lib/hive-jdbc-2.0.0-standalone.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J:Fo

apache Hadoop apache-hive hive

wamp apache rotatelog怪异问题

我正在尝试使用WampApache的RotateLog功能来组织每日日志。但是，我注意到访问日志写在两个地方。第一个文件是原始的access_log.log，第二个文件写入定义的旋转日志文件。添加到httpd.conf中以启用rotateLog的代码如下。CustomLog"|C:/wamp64/bin/apache/apache2.4.23/bin/rotatelogs.exeC:/wamp64/backup/logs/apache/access_log/access_log_%d-%m-%y.log86400"commonErrorLog"|C:/wamp64/bin/apache/apa

怪异 rotatelog section 文件 apache

hadoop - Apache Pig 本地处理 bz2 文件？

我可以看到pig可以本地读取.bz2文件，但我不确定它是否运行明确的作业将bz2拆分为多个输入拆分？谁能证实这一点？如果pig正在运行一个创建输入拆分的作业，有没有办法避免这种情况？我的意思是让MapReduce框架在框架级别将bz2文件拆分为多个输入片段的方法？最佳答案可拆分输入格式未在hadoop(或只为您运行MR作业的pig中)中实现，因此一个文件由一个作业拆分，然后由第二个作业处理拆分。输入格式定义了一个isSplittable方法，该方法定义原则上文件格式是否可以拆分。除此之外，大多数基于文本的格式将检查文件是否使用已

hadoop Apache section 读取器 bz2 mapreduce apache-pig

apache - Hadoop:map reduce 作业中的错误类路径

我在3个虚拟机中运行一个cloudera集群，并尝试通过mapreduce作业执行hbase批量加载。但我总是得到错误:error:Classorg.apache.hadoop.hbase.mapreduce.HFileOutputFormatnotfound所以，似乎map进程没有找到类。所以我尝试了这个:1)将hbase.jar添加到每个节点上的HADOOP_CLASSPATH2)将TableMapReduceUtil.addDependencyJars(job)/TableMapReduceUtil.addDependencyJars(myConf,HFileOutputForm

apache Hadoop job code class mapreduce hbase cloudera

java - 组织.apache.thrift : Invalid method name: 'authenticate'

我正在运行出现此错误的用户手册中的一些基本Accumulo代码。简单的谷歌搜索没有提供任何有用的信息。错误org.apache.accumulo.core.client.AccumuloException:org.apache.thrift.TApplicationException:Invalidmethodname:'authenticate'atorg.apache.accumulo.core.client.impl.ServerClient.execute(ServerClient.java:77)atorg.apache.accumulo.core.client.impl.C

authenticate amp accumulo section apache java hadoop

Hadoop MultipleOutputFormat 支持 org.apache.hadoop.mapreduce.Job

我是Hadoop的新手!现在我正在尝试将MultipleOutputFormat与hadoop2.2.0一起使用，但它们似乎只适用于已弃用的“JobConf”，而后者又使用已弃用的Mapper和Reducer(org.apache.hadoop.mapred.Reducer)等。关于如何使用新的“org.apache.hadoop.mapreduce.Job”实现多个输出功能有什么想法吗？最佳答案正如@JudgeMental指出的那样，您应该将MultipleOutputs与新API(mapreduce)一起使用，因为Multi

MultipleOutputFormat mapreduce code MultipleOutputs hadoop

Hive表字段类型转换错误解决：Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask.

文章目录1问题场景1.1问题发生的背景1.1操作方法11.2操作方法21.3报错信息2问题分析3解决方法3.1在SQL代码中加参数3.2在提交Hive程序时，附加上hiveconf参数3.3修改hive-site.xml文件1问题场景假设某有数据的Hive表temp_table的字段状况如下，需要将A字段由string类型转为int类型：字段名称字段类型是否为分区字段Astring否Bint否Cbigint否Dstring是1.1问题发生的背景在Hdfs数据库中，该表的数据是以Parquet文件格式存储的，包含多个分区。原本在该表中的字段A的类型为int。然而笔者误操作，将该字段的类型转换为了

表字 Execution span class token spark 数据库 hive

apache - 我的 Yarn Map-Reduce 作业花费了大量时间

输入文件大小:75GB映射器数量:2273reducer数量:1(如网页界面所示)分割数:2273输入文件数:867集群:ApacheHadoop2.4.05个节点集群，每个1TB。1个主节点和4个数据节点。已经4小时了。现在仍然只完成了12%的map。只是想知道我的集群配置是否有意义，或者配置有什么问题吗？Yarn-site.xmlyarn.nodemanager.aux-servicesmapreduce_shuffleyarn.nodemanager.aux-services.mapreduce.shuffle.classorg.apache.hadoop.mapred.Shuf

Map-Reduce apache lt gt property hadoop mapreduce cluster-computing hadoop-yarn

144 145 146147148 149 150