hadoop-examples

hadoop - 插入分桶表产生空表

我正在尝试插入分桶表。当我运行查询时，一切看起来都很好，我在报告中看到了一些写入的字节数。Hive日志中也没有任何错误。但是当我查看表格时，我什么都没有:(创建表测试(测试日期字符串，test_id字符串,test_title字符串,)聚类为(文本日期)进入100个桶行格式分隔由“|”终止的字段由'\n'终止的行存储为兽人地点'hdfs://myserver/data/hive/databases/test.db/test'TBL属性('skip.header.line.count'='1','交易'='真')插入测试.test从test2.green中选择“test_date”、“t

hadoop 插入 test br code hive hdfs hiveql orc

hadoop - 并行停用多个 Hadoop DataNode

我要更换HadoopCDH5.7集群中的多台机器。我首先添加了一些新机器并停用了相同数量的现有数据节点。我注意到在停用节点时block被标记为复制不足。这是否意味着我在停用多个节点时会面临风险？我可以并行停用所有节点吗？有没有更好的方法来更换所有机器？谢谢! 最佳答案很明显，当一个节点关闭(或删除)时，数据复制不足。当您添加新节点并重新平衡时，这将自动修复。实际发生了什么？假设集群上的复制因子是3。当一个节点退役时，存储在其上的所有数据都消失了，该数据的复制因子现在是2(因此处于复制状态)。现在，当您添加一个新节点并重新平衡时，丢

DataNode hadoop section strong 并重 cloudera cloudera-cdh

hadoop - Hbase Scan 返回超出范围的数据

我正在使用HBaseshell在HBase扫描中使用startRowKey和StopRowKey进行扫描，但我收到的输出超出了传递的范围。请引用Hbase查询-importorg.apache.hadoop.hbase.filter.CompareFilterimportorg.apache.hadoop.hbase.filter.SingleColumnValueFilterimportorg.apache.hadoop.hbase.filter.SubstringComparatorimportorg.apache.hadoop.hbase.util.Bytesscan'Table

hadoop Hbase section 39 hbase-shell

hadoop - 配置单元:dfs copyToLocal 给出 "org.apache.hive.service.cli.HiveSQLException: Error while processing statement: null"

我正在尝试从.hql文件执行“copyToLocal”，如下所示:dfs-copyToLocalhdfs://nameservice1/HDFS_FOLDER1/HDFS_FOLDER2/file_name.dat/LOCAL_FOLDER1/LOCAL_FOLDER2/;但是我得到了下面提到的异常:Error:Errorwhileprocessingstatement:null(state=,code=1)org.apache.hive.service.cli.HiveSQLException:Errorwhileprocessingstatement:nullatorg.apach

配置单 HiveSQLException java apache hive hadoop

java - Hadoop "Could not find or load main class com.sun.tools.javac.Main"

在我的问题作为重复问题被关闭之前:我查看了所有其他相关问题，但提供的解决方案对我不起作用，可能是因为我使用的是Cygwin，而不是Unix。我正在试用教程here.每当我运行命令(在c:/hadoop中)bin/hadoopcom.sun.tools.javac.MainWordCount.java时，我都会收到错误Couldnotfindorloadmainclasscom.sun.tools.javac.Main.我的Java_Home变量设置为:c:/PROGRA~1/Java/jdk1.7.0_17(echo$JAVA_HOME确认了这一点),和我的HADOOP_CLASSPA

amp Hadoop code section java bash cygwin

hadoop - 如何配置 hadoop rpc 的超时时间？

我的应用程序使用hadoop的rpc在分布式环境中远程发送/接收请求。org.apache.hadoop.ipc.RPC;org.apache.hadoop.ipc.RPC.Server;....this.server=RPC.getServer(this,this.peerAddr.getHostName(),this.peerAddr.getPort(),this.conf);this.server.start();随着任务越来越重，我观察到由于IOException(这可能是由线程中断引起的)导致的任务失败频繁。我怀疑异常是由某种RPC超时引起的。如何调整hadoop中RPC的超

hadoop rpc section this

hadoop - context.write() 方法中的 NullWritable

我如何才能在我的context.write()方法中只放入值。我不想在我的文本文件中写入key，所以我不想在我的context.write()方法中发出key。这是我的映射器代码:publicclassMyMapperextendsTableMapper{privatefinalIntWritableONE=newIntWritable(1);privateTexttext=newText();publicvoidmap(ImmutableBytesWritablerow,Resultvalue,Contextcontext)throwsIOException,InterruptedE

NullWritable context 34 IntWritable code hadoop mapreduce

file - '无法从空字符串创建路径'，使用 csv 的 hadoop -put 命令

我正在尝试将基本的csv文件拉入hdfs我正在使用这个:hadoopfs-putC:\Users\Desktop\Terrorism.csv/user/Mydata/terrorism.csv它给我以下错误:CannotcreateaPathfromanullstring我可以通过创建一个配置单元表并将数据加载到该表中来解决问题，但我只想将数据放到hdfs上。最佳答案在路径上使用转义，因为它是Windows并且使用反斜杠:)hadoopfs-copyFromLocalC:\\Users\\Desktop\\Terrorism.c

空字符 amp section code csv file hadoop hdfs

hadoop - 无法使用 hdfs 找到配置单元表目录

我在使用配置单元表时遇到了困难。使用配置单元表时。使用DESCRIBEFORMATTEDtbl_name时，我可以看到位置:hdfs路径。运行查询时，有一些记录返回。当我运行createtablenew_tableasselect*fromtbl_name时。可以创建表，但不能创建数据。在使用hdfsdfs-ls/table目录检查hdfs的地方，它返回“没有这样的文件或目录”。有人知道吗？提前致谢。最佳答案您可以看到$HIVE_HOME/conf目录中有hive-default.xml和/或hive-site.xml具有hiv

配置单 hadoop section code hive hdfs

hadoop - 无法全局访问 Kafka Spark Streaming 中的数据

我正在尝试将数据从Kafka流式传输到SparkJavaPairInputDStreamdirectKafkaStream=KafkaUtils.createDirectStream(ssc,String.class,String.class,StringDecoder.class,StringDecoder.class,kafkaParams,topics);我在这里迭代JavaPairInputDStream来处理RDD。directKafkaStream.foreachRDD(rdd->{rdd.foreachPartition(items->{while(items.hasNe

Streaming hadoop String code section apache-spark apache-kafka spark-streaming

54 55 565758 59 60