vm-cdh-cluster

rest - 它是 Hbase REST API `get version/cluster` 中的错误吗？

HbaseRESTAPI，此接口(interface)get'version/cluster'，当我使用headerAccept:application/json时，响应不是JSON而是纯文本。curl-XGET\-H"Accept:application/json"\"http://localhost:8888/version/cluster"#"1.2.2"但是当我使用Accept:text/xml时，响应是正确的XML。curl-XGET\-H"Accept:text/xml"\"http://localhost:8888/version/cluster"#1.2.2

hadoop - 如何增加MR或Hive CDH并行运行的Map任务数

MR作业启动时有128个映射器，但只有7个并行运行。如何增加并行运行的maptask的数量？谢谢最佳答案 mapreduce.tasktracker.map.tasks.maximum这将设置可以在tasktracker级别同时运行的最大maptask数。要在作业级别设置它，您可以使用mapreduce.job.running.map.limit。关于hadoop-如何增加MR或HiveCDH并行运行的Map任务数，我们在StackOverflow上找到一个类似的问题：

hadoop Hive section code stackoverflow mapreduce cloudera cloudera-cdh

hadoop - 无法从主机连接到 ZooKeeper/Hive 到 Sandbox Hortonworks HDP VM

我不久前下载了HDP-Sandbox(在OracleVirtualBoxVM中)，但很少使用它，现在我正在尝试使用HiveHDBC从外部世界访问数据。我使用来自apache的hive-jdbc1.2.2，它是我从mvnrepository获得的，所有依赖项都在类路径中，或者hortonworksJDBC从他们的存储库获得http://mvnrepository.com/artifact/org.apache.hive/hive-jdbc/1.2.2或http://repo.hortonworks.com/content/repositories/releases/org/apache/

Hortonworks ZooKeeper java DEBUG hadoop jdbc hive hortonworks-data-platform hortonworks-sandbox

hadoop - 无法在 cloudera VM 中将配置单元升级到 2.3.2

我将clouderavm中的hive版本升级到2.3.2'。它已成功安装，我将hive-site.xml文件从旧的/hive/conf文件夹复制到较新的conf文件夹并且没有Metastore的问题。但是，当我执行类似'droptabletable_name'`的查询时，它会抛出以下异常:FAILED:SemanticExceptionUnabletofetchtabletable_name.Invalidmethodname:'get_table_req'下面是我的hive-site.xml文件:javax.jdo.option.ConnectionURLjdbc:mysql://1

配置单 cloudera gt lt property hadoop hive bigdata cloudera-cdh

azure - 从本地机器访问 azure vm 中的 spark docker

Sparkdocker安装在azurevm(centos7.2)中，我想从我的本地机器(Windows)访问hdfs。我在Windows中运行curl-i-v-Lhttp://52.234.XXX.XXX:50070/webhdfs/v1/user/helloworld.txt?op=OPEN，异常是$curl-i-v-Lhttp://52.234.XXX.XXX:50070/webhdfs/v1/user/helloworld.txt?op=OPEN*timeoutonnamelookupisnotsupported*Trying52.234.XXX.XXX...*TCP_NODEL

azure docker code overruns dropped hadoop apache-spark ifconfig

apache-spark - Apache Spark : Differences between client and cluster deploy modes

TL;DR:在SparkStandalone集群中，客户端和集群部署模式有何区别？如何设置我的应用程序要运行的模式？我们有一个包含三台机器的SparkStandalone集群，它们都装有Spark1.6.1:一台主机，也是我们使用spark-submit运行我们的应用程序的地方2台相同的worker机器来自SparkDocumentation，我读到:(...)Forstandaloneclusters,Sparkcurrentlysupportstwodeploymodes.Inclientmode,thedriverislaunchedinthesameprocessasthecl

apache-spark Differences code Spark section apache-spark-standalone

apache-spark - 我们在yarn cluster中运行时在哪里可以看到spark输出控制台

我是Spark、Hadoop和Yarn的初学者。我用以下命令安装Spark:https://spark.apache.org/docs/2.3.0/和Hadoop/yarn:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html.我的目标是在yarncluster上运行spark应用程序，但我遇到了问题。我们怎么知道我们的设置何时工作？我会告诉你我的例子。完成设置后，我尝试运行测试jar:examples/jars/spark-examples*.jar。当我在

中运行时 spark section cluster apache-spark hadoop hadoop-yarn

hadoop - 是否可以在单独安装 Hadoop 和其他几个组件的 RHEL7 服务器上安装 CDH

我有一个RHEL7服务器，我试图在其中创建一个用于POC和学习目的的通用数据湖平台。我分别设置了Hadoop、Hive、Zookeeper、Kafka、Spark、Sqoop。单独安装这些组件被证明是一件棘手的事情，并且需要花费很多精力，即使这是出于内部目的而不是特定于生产。我现在正在尝试在此服务器中安装CDH包。有可能这样做吗？它会与当前的安装重叠吗？如何实现。注意:我们进行单独安装的原因是当时服务器中的互联网不可用。现在选择CDH的原因是在获得一些批准后几天可以使用互联网，加上CDH节省了大量时间和精力，并且包括设置数据湖所需的组件。有人可以帮我解决这个问题吗

hadoop section strong quickstart_docker_container bigdata cloudera cloudera-cdh rhel7

eclipse-plugin - hadoop 的 eclipse 插件是否与 CDH3 一起工作

我在我的机器上安装了clouderaCDH3。然后我尝试使用eclipse插件(JIRAMAPREDUCE-1280)来做一些MR任务。但是，由于某种原因，该插件似乎不适用于CDH3。它无法连接到DFS。插件是否正常工作？最佳答案 CDH3与ApacheHadoop0.20.2不兼容。来自JIRAMAPREDUCE-1280的Eclipse插件是针对ApacheHadoop构建的。它与CDH3不兼容。关于eclipse-plugin-hadoop的eclipse插件是否与CDH3一起

eclipse eclipse-plugin section CDH3 hadoop cloudera

java - Cloudera Hadoop VM 没有eclipse

我刚刚为VirtualBox和VMWarePlayer下载了最新的Cloudera虚拟机并启动了它们。https://ccp.cloudera.com/display/SUPPORT/Cloudera%27s+Hadoop+Demo+VM但是，除了安装hadoop之外，它们不再包含任何东西(如eclipse等)。我清楚地记得我曾经尝试过clouderaVM，其中包含整个安装的预配置示例、示例数据、eclipse等。我在这里进行了验证:http://www.philippeadjiman.com/blog/2009/12/07/hadoop-tutorial-part-1-setting

Cloudera eclipse section java hadoop mapreduce

73 74 757677 78 79