report_service

hadoop - 使用pywebhdfs创建hdfs文件报错: [Errno -2] Name or service not known

关于我的开发环境的一些信息:开放堆栈:朱诺hadoop:2.4.1pywebhdfs:0.4.0我通过openstacksahara客户端API创建一个hadoop集群，然后我想使用pywebhdfs创建一个文件到HDFS(用于在创建的hadoop集群上启Action业)。但是在创建HDFS文件时出现错误，错误信息为:HTTPConnectionPool(host='vanillacluster-vanillacluster-slave-vanilla-002.novalocal',port=50075):Maxretriesexceededwithurl:/webhdfs/v1/us

amazon-web-services - 在选择定价时，hadoop 分发下的 aws EMR 亚马逊标准是什么

我正在尝试计算AWSEMR服务的定价。我用谷歌搜索，但在默认的hadoop分布列下找不到什么是亚马逊标准。最佳答案假设您在http://calculator.s3.amazonaws.com/index.html谈论定价计算器，“HadoopDistribution”下拉列表中的“AmazonStandard”选项只是指AWSEMR自己的Hadoop分布(当然还有其他BigData应用程序，如Hive、Spark、Pig等)。也就是说，不是MapR分布之一，它们也受支持但具有不同的成本结构。这是EMR的默认发行版，因此您会知道您

amazon-web-services 分发 section 定价 stackoverflow hadoop amazon-emr

hadoop - 如何读取 `hadoop dfsadmin -report` 输出

命令:[hdfs@sandboxoozie]$hadoopdfsadmin-report|head-n100输出:DEPRECATED:Useofthisscripttoexecutehdfscommandisdeprecated.Insteadusethehdfscommandforit.ConfiguredCapacity:44716605440(41.65GB)PresentCapacity:31614091245(29.44GB)DFSRemaining:30519073792(28.42GB)DFSUsed:1095017453(1.02GB)DFSUsed%:3.46%Un

hadoop dfsadmin section DFS hdfs bigdata

amazon-web-services - 是否可以通过 EMR(通过 VPC)查看 Spark UI？

我已经完成了https://docs.aws.amazon.com/ElasticMapReduce/latest/ManagementGuide/emr-ssh-tunnel-local.html中描述的过程通过本地端口转发打开ssh隧道，然后转到http://localhost:8157/.这将打开Hadoop/YARN界面，此时我单击TrackingUI/ApplicationMaster链接，并收到“找不到此站点的服务器DNS”页面。根据AWS文档http://docs.aws.amazon.com/ElasticMapReduce/latest/ReleaseGuide/em

amazon-web-services services ElasticMapReduce section amazon hadoop apache-spark

amazon-web-services - 在 EC2 上设置 Hadoop 的脚本

在EC2上设置Hadoop的脚本，如https://wiki.apache.org/hadoop/AmazonEC2中所述已从最近的hadoop版本中删除。谷歌给我指出了一个替代方案http://whirr.apache.org/这也已经退休一年多了。是否有替代品或替代品仍然适合在EC2上设置最新版本的Hadoop？谢谢!更新hadoop-ec2脚本已从hadoopsrc中删除01/11/2011.目的是将其替换为ApacheWhirr.如果可以明确记录删除操作，那就太好了。不幸的是，Hadoop官方网站上不再方便地提供早期变更日志。最佳答案

amazon-web-services services noreferrer section noopener hadoop

hadoop - Apache Kylin 是 SSRS(SQL Server Reporting Services)的良好替代品吗？

我们有分析数据的框架，借助OLAP的立方体设计和有ETL连接的仓库，它们都是sqlServer结构和SSRS(SQLServerReportingServices)。我们的一些报告需要很长时间才能得出结论，我们决定迁移到Hadoop生态系统。ApacheKylin是这个框架的一个很好的替代品吗？最佳答案首先，我会将SQLServerAnalysisServices与Kylin进行比较，而不是将ReportingServices与ReportingServices进行比较，因为ReportingServices更接近于前端系统。根

替代品 Reporting Kylin section Services hadoop reporting-services ssrs-2008 hadoop2

amazon-web-services - 如何使用 HadoopJarStep Config.Step 属性？

AWS文档指出此属性是“作业流程步骤运行时设置的Java属性列表。您可以使用这些属性将键值对传递给JAR文件中的主函数。”但是没有解释(至少我没有找到)它们是如何传递的，以及如何在主函数端正确访问所述键值对集合。快速检查证明它们不是通过环境或命令行参数传递的。可以用其他方式吗？最佳答案好吧，似乎这个映射转到了Java系统属性，并且可以通过System.getProperties()调用从主函数端访问，但是有一些不明显的含义。首先要记住的是，它们在内部通过环境变量HADOOP_CLIENT_OPTS设置为-Dkey=value开关

amazon-web-services HadoopJarStep section shell 传递 hadoop emr amazon-emr

amazon-web-services - 在 AWS EMR 中编辑配置文件

在哪里可以找到AWSEMR的配置文件？主要是我在寻找hue.ini文件，我启动了一个新集群，打开了hueUI，创建了新的super用户并登录。然后我看到了该区域中的所有s3存储桶，但我无法访问存储桶中的文件，我不断收到此错误-Failedtoaccesspath:"s3a://data-storage"Checkthatyouhaveaccesstoreadthisbucketandthattheregioniscorrect:BadRequest.然后我尝试按照这个将我的s3帐户添加到hue-http://gethue.com/introducing-s3-support-in-hu

amazon-web-services services section hue code hadoop amazon-s3 amazon-emr

amazon-web-services - Spark - "spark.deploy.spreadOut = false"可以在 S3 上提供性能优势

我了解将“spark.deploy.spreadOut”设置为true可以使HDFS受益，但是对于S3，设置为false是否比true更有优势？最佳答案如果您正在运行Hadoop和HDFS，那么使用该属性适用的SparkStandalone调度程序不会对您有好处。相反，您应该运行YARN，并且ResourceManager确定执行程序的分布方式如果您在EC2中运行独立调度程序，则设置该属性会有所帮助，默认值为true。换句话说，你从哪里读取数据不是这里的决定因素，master的部署模式是更好的性能优势将来自您尝试读取的文件数量以

amazon-web-services amp section strong 中运 apache-spark hadoop amazon-s3 hdfs

hadoop - Flink Prometheus Push Gateway Reporter - 在作业关闭时删除指标

我已经按照文档指标部分中的说明设置了PrometheusPushGatewayReporter。我可以看到来自推送网关UI中公开的flinkjobmanager和taskmanagers的指标，以及它们已被Prometheus集群正确抓取。问题是，即使我明确设置了deleteOnJobShutdown配置选项，当通过flinkcli工具取消作业时，也只会删除jobmanager的指标。有没有办法同时删除陈旧的任务管理器指标？我的配置如下:metrics.reporter.promgateway.class:org.apache.flink.metrics.prometheus.Prom

Prometheus Reporter promgateway section metrics hadoop apache-flink hadoop-yarn prometheus-pushgateway