草庐IT

current_index

全部标签

ios - 如何获取每30个:00(30 minutes) from current time to 10:30 pm的时间间隔

需要帮助显示每30分钟的时间间隔,假设当前时间是上午11:45时间间隔应该是:12:00pm,12:30pm,01:00pm,01:30pm,02:00pm,02:30pm......10:30pm.NSString*time=@"10.30pm";NSDate*date1;NSDate*date2;{NSDateFormatter*formatter=[[NSDateFormatteralloc]init];[formattersetDateFormat:@"hh.mma"];date1=[formatterdateFromString:time];date2=[formatterd

使用子进程 hdfs "cat: Illegal file pattern: Illegal character range near index 11"打开 Python HDFS 文件

我正在尝试加载存储在HDFS中的Hadoop集群上的informatica日志文件。我在Python中使用subprocess来执行此操作,但相信由于文件名而出现错误,我不确定如何解决它。我得到的错误是“cat:非法文件模式:索引11附近的非法字符范围”我的代码是:input=subprocess.Popen(["hadoop","fs","-cat",'/corp_staffs/IT/IICOE/process/infa_stats/WorkflowLogs/infra.[08-04-2015-(15_19)].1438719569664.log'],stdout=subproces

indexing - HBase 是如何管理其索引的?

如果HDFS是只读的(或在基本场景中可追加),它如何维护有序索引?它是否将其索引存储在HDFS或一些永久存储中?[编辑]例如,假设我按此顺序添加了行FBAE。由于HDFS只能追加,我怀疑磁盘上行的顺序将与插入顺序相同。但它如何维护其索引或保持其键有序?-因为它存储key的区域是一次性写入的。 最佳答案 HBase没有索引。它具有有序键(大致相当于SQLServer中的聚集索引,或Oracle中的索引组织表,但没有b树),这些键使用有序分区和时间戳写入进行维护。当memstore达到特定(可配置)大小时,HFiles仅刷新到磁盘,你是

hadoop - 失败 : semanticexception the current builtin authoization in hive is incomplete and disabled

我启动哨兵服务(没有kerberos、ad或ldap),并配置hive、带哨兵的impala。然后我用beeline连接hive2(beeline>!connectjdbc:hive2://),并运行命令“createroletest_role”,但它抛出了一个错误。什么会导致它发生?日志如下:[root@cdh1~]#su-hive-s/bin/bash[hive@cdh1~]$beelineBeelineversion0.13.1-cdh5.3.0byApacheHivebeeline>!connectjdbc:hive2://scancompletein3msConnecting

java - Hadoop Java : how to specify map key as one of the index of input split?

我有一个看起来像这样的输入数据:3070801,1963,1096,,"BE","",,1,,269,6,69,,1,,0,,,,,,,3070802,1963,1096,,"US","TX",,1,,2,6,63,,0,,,,,,,,,3070803,1963,1096,,"US","IL",,1,,2,6,63,,9,,0.3704,,,,,,,3070804,1963,1096,,"US","OH",,1,,2,6,63,,3,,0.6667,,,,,,,3070805,1963,1096,,"US","CA",,1,,2,6,63,,1,,0,,,,,,,3070806,196

hadoop - 在 Hadoop 作业中调用 Solr Cloud Index 时出错

我的目标是运行一个弹性mapreduce作业,该作业在map阶段查询Solr索引并将结果写入S3。在Hadoop作业中构建Solr索引(即写入Solr索引)时,Solr和Hadoop可以很好地协同工作。当我运行作业来查询Solr索引时,我在尝试启动Solr客户端时收到错误消息。我怀疑Hadoop和Solr之间存在依赖性问题,我记得它们都使用不同版本的http客户端,错误是找不到方法的问题。这是堆栈跟踪2013-07-2403:17:47,082FATALorg.apache.hadoop.mapred.Child(main):Errorrunningchild:java.lang.No

hadoop - hive-site.xml 中的 hive.cli.print.current.db 停止工作

我曾经在$HIVE_HOME/conf/hive-site.xml中将hive.cli.print.current.db设置为true,以便在配置单元提示符中自动显示数据库名称。此配置最近停止工作,因此每次启动配置单元时我都必须手动设置它的值。有没有人遇到过同样的问题,你的解决方案是什么?谢谢! 最佳答案 此属性应在配置单元配置目录(/etc/hive/conf)的.hiverc文件中指定(而不是在hive-site.xml中)。创建文件/.hiverc如果不存在以下内容sethive.cli.print.current.db=tr

scala - 星火 SQL : access file in current worker node directory

我需要使用spark-sql读取一个文件,该文件在当前目录中。我使用此命令解压缩存储在HDFS上的文件列表。valdecompressCommand=Seq(laszippath,"-i",inputFileName,"-o","out.las").!!该文件在当前工作节点目录中输出,我知道这一点是因为通过scala执行"ls-a"!!我可以看到该文件在那里。然后我尝试使用以下命令访问它:valdataFrame=sqlContext.read.las("out.las")我假设sql上下文会尝试在当前目录中查找文件,但事实并非如此。此外,它不会抛出错误,而是会发出一条警告,指出找不到

hadoop - hbase-indexer solr numFound 与 hbase 表行大小不同

最近我的团队在CDH上使用hbase-indexer将hbase表列索引到solr。当我们部署hbase-indexer服务器(称为Key-ValueStoreIndexer)并开始测试时。我们发现hbase表和solr索引之间的行大小不同的情况:我们使用Phoenix来统计hbase表的行数:0:jdbc:phoenix:slave1,slave2,slave3:2181>SELECT/*+NO_INDEX*/COUNT(1)FROMC_PICRECORD;+------------------------------------------+|COUNT(1)|+---------

hadoop - Apache Hadoop 中的 "generally available"、 "production ready"、 "stable"和 "latest/current"之间有什么区别?

在描述软件产品版本的状态时,“普遍可用”、“生产就绪”、“稳定”和“最新/当前”之间有什么区别?我在ApacheHadoop网站上遇到了这些术语,在尝试选择正确的版本/发布/分发(这三个词也让我感到困惑)进行下载时:https://hadoop.apache.org/docs/r3.2.0/ApacheHadoop3.2.0incorporatesanumberofsignificantenhancementsoverthepreviousstableminorreleaseline(hadoop-3.1).Thisisthefirstreleasein3.2releaselinewh