草庐IT

evicted_keys

全部标签

hadoop - 用于实时分析解决方案的 HBase 架构/ key

我们正在考虑使用HBase进行实时分析。在HBase之前,我们将在我们的日志文件上运行HadoopMapReduce作业并聚合数据,并将细粒度聚合结果存储在HBase中,以便对聚合数据进行实时分析和查询。因此HBase表将具有预先聚合的数据(按日​​期)。我的问题是:如何最好地设计HBase数据库的架构和主键设计,以实现快速而灵活的查询。例如,假设我们将以下行存储在数据库中:timestamp,client_ip,url,referrer,useragent假设我们的map-reduce作业产生三个不同的输出字段,我们希望将每个字段存储在一个单独的“表”(HBase列族)中:日期、操作

java - 哪个key类适合二次排序?

在Hadoop中,您可以使用二次排序机制在将值发送到reducer之前对其进行排序。这在Hadoop中完成的方式是将要排序的值添加到键,然后有一些自定义组和键比较方法Hook到排序系统。因此,您需要有一个主要由真实键和排序依据值组成的键。为了使其执行得足够快,我需要一种创建组合键的方法,该组合键也很容易分解为组和键比较方法所需的单独部分。最聪明的方法是这样做。是否有一个“开箱即用”的Hadoop类可以在这方面帮助我,或者我是否必须为每个map-reduce步骤创建一个单独的关键类?如果key实际上是由多个部分组成的组合(由于分区程序,也需要单独使用),我该怎么做?你们有什么推荐的?附言

hadoop - Hive:当插入分区表时,在大多数行中,hive double url-encode partition key column

我创建了一个分区表:createtablet1(amountdouble)partitionedby(events_partition_keystring)storedaspaquet;向tmp_table添加了一些数据,其中'events_partition_key'列包含以下格式的时间戳(字符串类型):“2018-02-2500:00:00”然后我向分区表中插入一些数据。insertintotablet1partition(events_partition_key)selectamount,events_partition_keyfromtmp_table当从新的分区表t1中选择时

java - 错误的 key 类 : Text is not IntWritable

这看起来像是一个愚蠢的问题,但我在我的hadoopmapreduce代码中没有看到我的类型中的问题如问题中所述,问题在于它期望IntWritable但我在reducer的collector.collect中将一个Text对象传递给它。我的作业配置具有以下映射器输出类:conf.setMapOutputKeyClass(IntWritable.class);conf.setMapOutputValueClass(IntWritable.class);以及以下reducer输出类:conf.setOutputKeyClass(Text.class);conf.setOutputValueC

hadoop - 找不到带有 key dfs.encryption.key.provider.uri 的 uri 以在 CDH 5.4 的 HDFS 加密中创建 key 提供程序

CDH版本:CDH5.4.5问题:当使用HadoopCDH5.4中可用的KMS启用HDFS加密时,将文件放入加密区域时出错。步骤:Hadoop的加密步骤如下:创建key[成功][tester@master~]$hadoopkeycreate'TDEHDP'-providerkms://https@10.1.118.1/key_generator/kms-size128tdegrouphasbeensuccessfullycreatedwithoptionsOptions{cipher='AES/CTR/NoPadding',bitLength=128,description='null

hadoop - 将 --negotiate 与 curl 一起使用时,是否需要 key 表文件?

documentation描述如何连接到kerberos安全端点显示如下:curl-i--negotiate-u:"http://:/webhdfs/v1/?op=..."必须提供-u标志,但被curl忽略。--negotiate选项是否会导致curl查找预先使用kinit命令创建的key表,或者curl会提示输入凭据?如果它查找key表文件,该命令将查找什么文件名? 最佳答案 成为curl的一次性贡献者在那个区域。以下是您需要了解的内容:curl(1)本身对Kerberos一无所知,并且不会与您的凭据缓存或key表文件进行交互。它

hadoop - 如何将 AWS 访问 key ID 和 secret 访问 key 指定为 amazon s3n URL 的一部分

我将输入和输出文件夹作为参数从网页传递给mapreduce字数统计程序。出现以下错误:HTTPStatus500-Requestprocessingfailed;nestedexceptionisjava.lang.IllegalArgumentException:AWSAccessKeyIDandSecretAccessKeymustbespecifiedastheusernameorpassword(respectively)ofas3nURL,orbysettingthefs.s3n.awsAccessKeyIdorfs.s3n.awsSecretAccessKeypropert

scala - 通过 key 写入多个输出 Spark - 一个 Spark 作业

如何在单个作业中使用Spark写入依赖于key的多个输出。相关:WritetomultipleoutputsbykeyScaldingHadoop,oneMapReduceJob例如sc.makeRDD(Seq((1,"a"),(1,"b"),(2,"c"))).writeAsMultiple(prefix,compressionCodecOption)将确保catprefix/1是ab和catprefix/2会是c编辑:我最近添加了一个新答案,其中包括完整导入、皮条客和压缩编解码器,请参阅https://stackoverflow.com/a/46118044/1586965,除了较

php - 无法解密数据 - openssl_private_decrypt() : key parameter is not a valid private key

"C:\wamp\bin\apache\Apache2.4.4\conf\openssl.cnf","private_key_bits"=>2048,"private_key_type"=>OPENSSL_KEYTYPE_RSA,);//Createtheprivateandpublickey$res=openssl_pkey_new($config);if($res===false)die('Failedtogeneratekeypair.'."\n");if(!openssl_pkey_export($res,$privKey,"phrase",$config))die('Fail

php - 如何在 PHP 中没有硬编码 key 的情况下进行对称加密

我正在使用PHPmcrypt库使用AES加密和存储(MySQL)数据。我想知道是否有一种好的方法可以在我的代码中没有硬编码加密/解密key的情况下执行此操作。如果黑客可以访问我的服务器,他将能够看到代码中的文件和我的key,从而访问数据库中的所有数据。谢谢。 最佳答案 I'musingthePHPmcryptlibrarytocryptographandstore(MySQL)datausingAES.Youmaywishtoreconsideryourchoiceincryptographylibrary.Iwaswonderin