草庐IT

command-line-options

全部标签

hadoop - HUE 查询编辑器给出 "dfs command"错误

对于下面的查询:错误:OKFAILED:ParseExceptionline1:0cannotrecognizeinputnear'dfs''-''cp'有人可以指导我吗? 最佳答案 不要将您的源网址和目标网址放在单引号之间。如下所示:dfs-cppath/to/your/sourcepath/to/your/destination 关于hadoop-HUE查询编辑器给出"dfscommand"错误,我们在StackOverflow上找到一个类似的问题: ht

arrays - 配置单元 : ParseException line 3:23 cannot recognize input near 'from'

我试图创建这个表:createtabletmp_test(id_string,myelementarray>)STOREDASPARQUETLOCATION'/donne/tmp_test'我有这个错误:编译语句时出错:失败:ParseException行3:23无法识别列规范中“来自”“:”“字符串”附近的输入。我如何转义单词“from”,因为我必须使用这个词?谢谢你的帮助 最佳答案 FROM是Hive中的保留关键字。使用反引号(`)来引用它,createtabletmp_test(id_string,myelementarray

sql - 失败 : ParseException line 1:36 cannot recognize input near '1987'

我正在尝试用它在Hive中创建一个外部表CREATEEXTERNALTABLEIFNOTEXISTS1987(YEARINT,MONTHINT,DAYOFMONTHINT,DAYOFWEEKINT,DEPTIMEINT,CRSINT,ARRTIMETIME,CARRIERSTRING,FLIGHTNUMINT,TAILNUMSTRING,ACTUALELAPSEDINT,CRSELAPSEDINT,AIRTIMEINT,ARRDELAYINT,DEPDELAYINT,ORIGINSTRING,DESTSTRING,DISTANCEINT,TAXIININT,TAXIOUTINT,CAN

hadoop - pig : how to separate data by positions in a single line

通常,如果我们在一行中有任何分隔符,我们会这样做。load"pigtest.txt"usingPigStorage(',')as(year:int,temp:float);下面是单行数据的示例。0029029070999991901010106004+64333+023450FM12+000599999V0202701N015919999999N0000001N9-00781+99999102001ADDGF108991999999999999999999我需要提取年份1901(16thpositionto4positions)吨emperature(89thpositionto4po

bash - JQ,Hadoop : taking command from a file

我一直在享受JQ(Doc)提供的强大过滤器。Twitter的公共(public)API提供格式良好的json文件。我可以访问其中的大量内容,并且可以访问Hadoop集群。在那里,我决定不使用Elephantbird将它们加载到Pig中,而是在mapperstreaming中尝试JQ看看它是否更快。这是我的最终查询:nohuphadoopjar$HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-2.5.1.jar\-files$HOME/bin/jq\-Dmapreduce.map.memory.mb=2048\-Dmapred.ou

linux - yarn -env.sh : command not found

我在Ubuntu16.04上安装了Hadoop2.7.2。当我运行命令时:start-yarn.sh它给出了以下输出:startingyarndaemons/usr/local/hadoop-2.7.2/etc/hadoop/yarn-env.sh:line122:rt:commandnotfoundstartingresourcemanager,loggingto/usr/local/hadoop-2.7.2/logs/yarn-hduser-resourcemanager-brij-Compaq-15-Notebook-PC.out/usr/local/hadoop-2.7.2/e

hadoop - Spark : Minimize task/partition size skew with textFile's minPartitions option?

我正在通过sc.textFile("/data/*/*/*")之类的方式将数万个文件读入rdd>一个问题是这些文件中的大多数都是微小的,而其他的则巨大。这会导致任务不平衡,从而导致各种众所周知的问题。我能否通过sc.textFile("/data/*/*/*",minPartitions=n_files*5)读取数据来拆分最大的分区,其中n_files是输入文件的个数吗?如约定elsewhere在stackoverflow上,minPartitions被传递到hadooprabithole,并在org.apache.hadoop.mapred.TextInputFormat.getSp

hadoop - 失败 : ParseException line 3:0 character ' ' not supported here

我收到这个错误:'FAILED:ParseExceptionline3:0character' 'notsupportedhere'在Hive上执行以下查询时:createexternaltablehbaselabreport(keystring,patientnamestring)storedby'org.apache.hadoop.hive.hbase.HBaseStorageHandler'withserdeproperties("hbase.columns.mapping"=":key,pd:patientname","hbase.table.name"="labreport"

hadoop - Airflow 失败 : ParseException line 2:0 cannot recognize input near

我正在尝试在Airflow上运行测试任务,但我不断收到以下错误:FAILED:ParseException2:0cannotrecognizeinputnear'create_import_table_fct_latest_values''.''hql'这是我的AirflowDag文件:importairflowfromdatetimeimportdatetime,timedeltafromairflow.operators.hive_operatorimportHiveOperatorfromairflow.modelsimportDAGargs={'owner':'raul','s

hadoop - HIVE - "skip.footer.line.count"在 Impala 中不起作用

我正在将平面文件传送到hdfs。文件的一般结构如下:我在这个数据集之上构建了一个外部配置单元表。下面是我的配置单元ddl:createexternaltableext_test(idstring,namestring,agestring)rowformatDELIMITEDFIELDSTERMINATEDBY','STOREDASTEXTFILELOCATION''TBLPROPERTIES('skip.footer.line.count'='1','skip.header.line.count'='2')当我在HIVE中查询select*fromext_test时;我从外部表中得到了