草庐IT

continuation-local-storage

全部标签

hadoop - kadmin 不能创建 principle 但 kadmin.local 可以

我正在Cloudera5beta上启用安全模式。使用cloudera管理器并在执行来自here的安全启用文档的第8步之后clouderamanager应该触发GenerateCredential命令,但事实并非如此。所以我正在做的是手动运行GenerateCredential,但它给我错误日志。KADMIN='kadmin-k-t/etc/cloudera-scm-server/cmf.keytab-pcloudera-scm/admin@IMP.CO.IN-rIMP.CO.IN'+kadmin-k-t/etc/cloudera-scm-server/cmf.keytab-pcloud

java - Hadoop datanode 启动失败 org.apache.hadoop.hdfs.server.common.Storage : Cannot lock storage

我在尝试在Hadoop中启动数据节点时遇到一些问题,从日志中我可以看到数据节点启动了两次(部分日志如下):2012-05-2216:25:00,369INFOorg.apache.hadoop.hdfs.server.datanode.DataNode:STARTUP_MSG:/************************************************************STARTUP_MSG:StartingDataNodeSTARTUP_MSG:host=master/192.168.0.1STARTUP_MSG:args=[]STARTUP_MSG:ve

hadoop - 从 s3 ://to local file system 复制文件

我是aws新手。我创建了一个集群并通过ssh连接到主节点。当我尝试将文件从s3://my-bucket-name/复制到pig中的本地file://home/hadoop文件夹时,使用:cps3://my-bucket-name/path/to/filefile://home/hadoop我得到错误:2013-06-0818:59:00,267[main]ERRORorg.apache.pig.tools.grunt.Grunt-ERROR2999:Unexpectedinternalerror.AWSAccessKeyIDandSecretAccessKeymustbespecifi

storage - 实现大规模日志文件分析

谁能给我指点引用或提供有关Facebook、雅虎、谷歌等公司如何执行大规模(例如多TB范围)日志分析的引用资料或高级概述,这些分析是他们为运营所做的,尤其是网络分析?特别关注网络分析,我对两个密切相关的方面很感兴趣:查询性能和数据存储。我知道一般方法是使用mapreduce将每个查询分布到集群上(例如使用Hadoop)。但是,最有效的存储格式是什么?这是日志数据,所以我们可以假设每个事件都有一个时间戳,并且通常数据是结构化的而不是稀疏的。大多数网络分析查询涉及分析两个任意时间戳之间的数据片段,并检索该数据中的聚合统计信息或异常情况。像BigTable(或HBase)这样的面向列的数据库

Hadoop/YARN 作业失败 - "exited with exitCode: -1000 due to: Could not find any valid local directory for nmPrivate..."

我正在尝试使用Hadoop、YARN和Accumulo运行MapReduce作业。我收到以下输出,但我无法找到问题所在。看起来是YARN问题,但我不确定它在寻找什么。我在$HADOOP_PREFIX/grid/hadoop/hdfs/yarn/logs位置有一个nmPrivate文件夹。这是它说找不到的文件夹吗?14/03/3108:48:46INFOmapreduce.Job:Jobjob_1395942264921_0023failedwithstateFAILEDdueto:Applicationapplication_1395942264921_0023failed2times

hadoop - Spark : saveAsTextFile() only creating SUCCESS file and no part file when writing to local filesystem

我正在使用以下命令将RDD写入文件:rdd.coalesce(1).saveAsTextFile(FilePath)当FilePath是HDFS路径(hdfs://node:9000/folder/)时一切正常。当FilePath是本地路径(file:///home/user/folder/)时,一切似乎都正常。输出文件夹已创建,SUCCESS文件也已存在。但是我没有看到任何包含输出的part-00000文件。没有其他文件。spark控制台输出也没有错误。我还尝试在调用saveAsTextFile()之前调用RDD上的collect,为输出文件夹提供777权限,但没有任何效果。请帮忙。

hadoop - Rack-local map任务和Data-local map任务有什么区别?

当我运行“hadoopjob-statusxxx”时,输出以下一些列表。Rack-localmaptasks=124Data-localmaptasks=6Rack-localmaptasks和Data-localmaptasks有什么区别? 最佳答案 在本地数据任务中,不需要复制任何内容。那是因为该block与计算物理上位于同一台服务器上。下一层是机架本地任务,这里必须复制数据,因为没有可用的所需block的本地副本。请注意,本地机架仅在网络的本地机架交换中复制。还有最坏的情况,数据在本地不可用,也不在同一机架上。所以这必须通过两

hadoop - 为什么 Hadoop 报告 "Unhealthy Node local-dirs and log-dirs are bad"?

我正在尝试在我的PC上设置单节点Hadoop2.6.0集群。访问时http://localhost:8088/cluster,我发现我的节点被列为“不健康节点”。在健康报告中,它提供了错误:1/1local-dirsarebad:/tmp/hadoop-hduser/nm-local-dir;1/1log-dirsarebad:/usr/local/hadoop/logs/userlogs怎么了? 最佳答案 local-dirs坏的最常见原因是节点上的可用磁盘空间超过了yarn的max-disk-utilization-per-di

storage - 可扩展的图像存储

我目前正在为基于Web的应用程序设计架构,该应用程序还应提供某种图像存储。用户将能够上传照片作为该服务的主要功能之一。查看这些图像也将是主要用途之一(通过网络)。但是,我不确定如何在我的应用程序中实现这样一个可扩展的图像存储组件。我已经考虑过不同的解决方案,但由于缺少经验,我期待听到您的建议。除了图像,还必须保存元数据。以下是我的初步想法:使用HDFS等(分布式)文件系统,并准备专用网络服务器作为“文件系统客户端”,以保存上传的图像和服务请求。图像元数据保存在附加数据库中,包括每个图像的文件路径信息。在HDFS之上使用HBase等面向BigTable的系统,并将图像和元数据保存在一起。

php - Wordpress Cron 错误 "SSL certificate: unable to get local issuer certificate"

我在安装Wordpress时遇到错误,wp-cron.php无法由Wordpress执行。调试工具“Crontrol”报错“SSL证书:无法获取本地颁发者证书”。WGET无法访问wp-cron.php很可能是由于SSL问题。我需要wp-cron来运行时事通讯工具等。很奇怪,同样的错误发生在同一服务器上的其他WP安装上,这些WP安装甚至没有SSL证书,甚至没有使用HTTPS。错误保持不变。我已经尝试用其他Wordpress插件找出问题的根源,但没有成功。由于该消息与站点无关,或者我猜问题出在Wordpress以外的其他地方。任何想法都很高兴。谢谢! 最佳答案