草庐IT

default_script

全部标签

java - 特定表的 hbase-default.xml 中单元格的最大大小

是否可以在hbase-default.xml中为特定表配置单元格的最大大小。如果可能,请告诉我我们配置最大单元格大小的方法列表。Reference:Igotthiserror,java.lang.IllegalArgumentException:**KeyValuesize**toolargeatorg.apache.hadoop.hbase.client.HTable.validatePut(HTable.java:1312)atorg.apache.hadoop.hbase.client.HTable.doPut(HTable.java:941)atorg.apache.hadoo

docker - Hue 访问 HDFS : bypass default hue. ini?

设置我正在尝试使用bde2020提供的图像组成一个轻量级的最小hadoop堆栈。(学习目的)。现在,堆栈包括(除其他外)一个名称节点数据说明色调基本上,我是从欧洲大数据开始的officialdockercompose,并添加了一个基于theirdocumentation的色调图像问题Hue的文件浏览器无法访问HDFS:Cannotaccess:/user/dav.TheHDFSRESTserviceisnotavailable.Note:youareaHueadminbutnotaHDFSsuperuser,"hdfs"orpartofHDFSsupergroup,"supergrou

hadoop - 无法建立与本地主机的连接 :10000/default: java.net.ConnectException:连接被拒绝

我从事Hadoop/Hive方面的工作。我已经安装了Hadoop1.1.2和Hive0.10.0。当我使用Hive作为命令提示符时它工作正常,但是当我在Eclipse中使用它时JDBC然后给出以下错误:Couldnotestablishconnectiontolocalhost:10000/default:java.net.ConnectException:Connectionrefused 最佳答案 您可以通过两种模式连接到Hive。通过thriftserver和嵌入式模式。通过查看您的urllocalhost:10000/def

hadoop - 有没有办法在 Pig Script 中创建索引?

我有一个没有ID号(索引)的数据文件。可以使用UDF或pig中的任何内置函数为每个条目创建索引吗?例如:data=load'myfile.txt'usingPigStorge(',')AS(speed:float,location:charrarray);A=foreachdatagenerateindexas(Id:int),speed,location;我在将数据从pig加载到Hbase时遇到问题,因为hbase将速度读取为行键值,并且我的文件中有许多重复数据(速度)。我想将索引设置为行键值并存储在Hbase表中。你对此有什么建议吗?谢谢你。 最佳答案

hadoop - SET default_parallel 1;声明不适用于 pig

我是pig的新手,根据我的理解,SETdefault_parallel1语句应该生成一个输出文件,因为它将使用一个reducer。但是当我在下面的脚本中使用这个命令时,它给了我2个o/p文件。SETdefault_parallel1;A=LOAD'hdfs:/pigfldr/union1'usingPigStorage('')AS(sln:int);B=LOAD'hdfs:/pigfldr/union2'usingPigStorage('')AS(sln:int);C=UNIONA,B;STORECINTO'hdfs:/pigfldr/unionfres';

hadoop - hadoop-2.7.3 中的 yarn : yarn-default. xml 位置

我们正在尝试在hadoop-2.7.3中找到yarn-default.xml的位置,有人可以指出它可能位于的位置......我能够找到yarn-site.xml但找不到yarn-default.xml如果有人能指出它的位置,将不胜感激。 最佳答案 在包含您的hadoop安装的目录中导航到share/doc/hadoop/hadoop-yarn/hadoop-yarn-common.如您所知,yarn-default.xml用作默认值的文档,而yarn-site.xml代表您的自定义配置值。

shell - Oozie 和 Hue : Permission Denied while running shell script

我在HDFS/user/user中有一个shell脚本sample_shell.sh,如下所示:source/user/user/params_new.cfgecho"HELLOWORLD"echo$layerparams_new.cfg也位于HDFS/user/user目录中,其内容为:layer="S"我是Oozie的新手,正在尝试在Hue中设置一个Oozie工作流程,它将执行sample_shell.sh脚本。属性如下:${jobTracker}${nameNode}/user/user/sample_shell.sh/user/user/sample_shell.sh#samp

hadoop - 无法在伪分布式模式下运行 Pig Script

我正在尝试编写一个pig脚本。我已经成功地在本地模式下工作,但是当我在Psudo分布式模式下启动pig时出现错误。这是脚本:register'myfolder/target/myfunc-with-dependencies.jar';SETmapred.cache.files/tmp/scripts#scripts,/tmp/my_rules#my_rules;SETmapred.create.symlinkyes;%defaultINPUT'test.seq'%defaultOUTPUT'final.out'%defaultTIMEOUT_MS'180000'%defaultUSE_

Hadoop hive : Generate Table Name and Attribute Name using Bash script

在我们的环境中,我们无法访问Hive元存储来直接查询。我需要为一组表动态生成表名、列名对。我试图通过对所有表的文件运行“describeextended$tablename”并从文件中选取表名和列名对来实现这一点。除了这种方式,还有其他更简单的方法吗?想要的输出是这样的table1|col1table1|col2table1|col3table2|col1table2|col2table3|col1 最佳答案 此脚本将为单个表以所需格式打印列。AWK从describe命令解析字符串,只接受column_name,用“|”连接和tab

hadoop - 了解作业 conf.xml 参数 pig.script.features

参数是什么pig.script.features66080在jobs_*_conf.xml中表示?它对调整hadoop集群/pig工作流有用吗?网上是否有此类参数的列表及其值的解释? 最佳答案 此参数来自PIG-1333它实际上只不过是脚本级功能的紧凑表示。您看到一个整数值,但它实际上是一个位设置,用于确定在整个Pig脚本中使用哪些功能(不仅仅是在作业级别)关于功能本身,您可以查看以下枚举:staticenumPIG_FEATURE{UNKNOWN,MERGE_JION,REPLICATED_JOIN,SKEWED_JOIN,HAS