草庐IT

line-length

全部标签

sql - 失败 : ParseException line 1:36 cannot recognize input near '1987'

我正在尝试用它在Hive中创建一个外部表CREATEEXTERNALTABLEIFNOTEXISTS1987(YEARINT,MONTHINT,DAYOFMONTHINT,DAYOFWEEKINT,DEPTIMEINT,CRSINT,ARRTIMETIME,CARRIERSTRING,FLIGHTNUMINT,TAILNUMSTRING,ACTUALELAPSEDINT,CRSELAPSEDINT,AIRTIMEINT,ARRDELAYINT,DEPDELAYINT,ORIGINSTRING,DESTSTRING,DISTANCEINT,TAXIININT,TAXIOUTINT,CAN

hadoop - pig : how to separate data by positions in a single line

通常,如果我们在一行中有任何分隔符,我们会这样做。load"pigtest.txt"usingPigStorage(',')as(year:int,temp:float);下面是单行数据的示例。0029029070999991901010106004+64333+023450FM12+000599999V0202701N015919999999N0000001N9-00781+99999102001ADDGF108991999999999999999999我需要提取年份1901(16thpositionto4positions)吨emperature(89thpositionto4po

hadoop - Nutch 非法参数异常 : Row length 41221 is > 32767

我已经添加了一组种子以使用此命令进行抓取./bin/crawl/largeSeeds1http://localhost:8983/solr/ddcd4对于第一次迭代,所有命令(注入(inject)、生成、提取、解析、更新表、索引器和删除重复项。)都已成功执行。对于第二次迭代,“CrawlDBupdate”命令失败(请参阅错误日志以供引用),由于此命令失败,整个过程被终止。软件栈为nutch-branch-2.3.1、gora-hbase0.6.1Hadoop2.5.2、hbase-0.98.8-hadoop216/01/2002:45:19INFOparse.ParserJob:Par

hadoop - 组织.apache.hadoop.ipc.RpcException : RPC response exceeds maximum data length

我已经在2台机器上设置了hadoop集群。一台机器同时有master和slave-1。第二台机器有slave-2。当我使用start-all.sh启动集群时,我在secondarynamenode的.out文件中遇到以下错误:java.io.IOException:Failedonlocalexception:org.apache.hadoop.ipc.RpcException:RPCresponseexceedsmaximumdatalength;HostDetails:localhostis:"ip-10-179-185-169/10.179.185.169";destinatio

hadoop - 失败 : ParseException line 3:0 character ' ' not supported here

我收到这个错误:'FAILED:ParseExceptionline3:0character' 'notsupportedhere'在Hive上执行以下查询时:createexternaltablehbaselabreport(keystring,patientnamestring)storedby'org.apache.hadoop.hive.hbase.HBaseStorageHandler'withserdeproperties("hbase.columns.mapping"=":key,pd:patientname","hbase.table.name"="labreport"

hadoop - Airflow 失败 : ParseException line 2:0 cannot recognize input near

我正在尝试在Airflow上运行测试任务,但我不断收到以下错误:FAILED:ParseException2:0cannotrecognizeinputnear'create_import_table_fct_latest_values''.''hql'这是我的AirflowDag文件:importairflowfromdatetimeimportdatetime,timedeltafromairflow.operators.hive_operatorimportHiveOperatorfromairflow.modelsimportDAGargs={'owner':'raul','s

hadoop - HIVE - "skip.footer.line.count"在 Impala 中不起作用

我正在将平面文件传送到hdfs。文件的一般结构如下:我在这个数据集之上构建了一个外部配置单元表。下面是我的配置单元ddl:createexternaltableext_test(idstring,namestring,agestring)rowformatDELIMITEDFIELDSTERMINATEDBY','STOREDASTEXTFILELOCATION''TBLPROPERTIES('skip.footer.line.count'='1','skip.header.line.count'='2')当我在HIVE中查询select*fromext_test时;我从外部表中得到了

hadoop - 错误消息 : "offset (0) + length (4) exceed the capacity of the array: 2" while fetching data from HBase

由于上述错误,我基于tomcat的RESTAPI应用程序无法处理请求。我在尝试从HBase检索数据时遇到错误。我使用RESTFul网络服务作为我的界面。我正在使用包含HBase0.98.6的CDH5.3.1。有谁知道如何解决这个问题?在此处输入代码错误详情:错误信息:“偏移量(0)+长度(4)超出数组的容量:2” 最佳答案 也许您需要更改一些架构类型规范?我得到这个错误,除了offset(0)+length(4)exceedthecapacityofthearray:1。这是因为缺少相关列的值,我假设1个字节表示空值。在Java中使

hadoop - PIG 拉丁语 : While loading how to discard the first line in any file?

我从一段时间以来一直在使用PIG,想知道如何在加载文件时不考虑第一行。我有一个包含标题的文件。所以我应该忽略第一行并转到下一行对日期列和所有列进行处理。如何解决这个问题?谢谢 最佳答案 如果你有pig版本0.11,你可以试试这个:input_file=load'input'USINGPigStorage(',')as(row1:chararay,row2:chararray);ranked=rankinput_file;NoHeader=Filterrankedby(rank_input_file>1);New_input_file

hadoop - 亚马逊弹性 map 减少 : Listing job flows in command line tools Issue?

我是Amazon网络服务的新手,我正在尝试使用命令行界面工具在Amazonelasticmapreduce作业上运行作业流。我按照来自aws的开发人员指南的亚马逊开发人员指南中的步骤进行操作。但事情对我来说并不清楚。如果我执行命令./elastic-mapreduce--list列出作业流程。显示以下错误。/home/pdurai/Applications/elastic-mapreduce-cli/amazon/coral/httpdestinationhandler.rb:23:warning:elsewithoutrescueisuseless/usr/local/rbenv/v