azure-databricks

azure - hdinsight pig 作业提交 502 错误

我在将pig作业提交到hdinsight集群时收到502错误。关于如何修复集群的任何想法？上次出现此错误时，我删除了集群并重新创建了它，想找到一种更好的方法来修复该错误。这是我得到的错误:Microsoft.WindowsAzure.Management.HDInsight.Framework.Core.Library.WebRequest.HttpLayerException:Requestfailedwithcode:BadGatewayContent:502-Webserverreceivedaninvalidresponsewhileactingasagatewayorprox

azure - SLF4J : Class path contains multiple SLF4J bindings on azure hdinsight

我已经创建了一个配置单元外部表来访问hbase表，方法是遵循HBase-HiveIntegrationanswer.下面是我创建外部表的配置单元查询:CREATEEXTERNALTABLEhive_tweets_by_message_words_key(keyINT,dSTRING)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,d:d")TBLPROPERTIES("hbase.table.name"="tweets_

azure SLF4J SLF4 section hadoop hive hbase azure-hdinsight

azure - 如何在 hdfs 中启用校验和值？

如何在hdfs中启用校验和值。在azure的hdinsight集群顶部使用hadoop(Hadoop2.7.3)。我尝试使用此命令检查校验和值:-hadoopfs-checksum/filename.txt然后校验和值为NONE。阅读here“通常的校验和是‘无’。所以我的问题是如何启用校验和值？最佳答案请尝试在AzureHDInsight上为HDFS命令。hadoopfs-checksumwasbs://containername@xxxx.blob.core.windows.net/folder/filename.txt

何在 azure section hadoop code hdfs azure-hdinsight

azure - HDInsight 和 Talend Open Studio for Big Data

我目前正在开展一个项目，我需要将TalendopenStudioforBigData(v6.3.1)连接到Azure的HDInsight(3.5)Hadoop集群。到目前为止，我正在尝试一个简单的例子，它包括创建一个Hive表。为此，我使用了下图:配置单元连接配置如下:...请在下面找到tHiveCreateTable_1节点的规范:通过运行这个过程:·创建了指定的容器和部署Blob(见下图)——这让我相信Windows存储配置一切正常·但是tHiveCreateTable_1节点有错误(见下图)·我坚信它与主机名和端口有关；·我尝试使用集群的主机名和我们可以在Ambari中找到的Hi

HDInsight Talend image noreferrer noopener azure hadoop hive azure-hdinsight

azure - Azure 上的 Hadoop，我可以为 I/O 使用不同的 Blob 存储容器吗？

我目前正在从事一个在Azure上创建大数据架构的项目。为了了解Azure的工作原理，我创建了数据工厂和Blob存储，并在按需HDInsight系统上为字数统计Hadoop进程设置了管道。这是管道的JSON文件:{"name":"MRSamplePipeline5","properties":{"description":"SamplePipelinetoRuntheWordCountProgram","activities":[{"type":"HDInsightMapReduce","typeProperties":{"className":"wordcount","jarFileP

容器 Hadoop 34 cnauroth Azure

azure - 我在 Azure HDInsight 上的 webHDFS url 是什么？

这里是azure的新手。我刚刚在常规存储帐户上启动了一个新的HDInsight实例和一个新的存储实例。我想知道我的webHDFS网址是什么/我可以在哪里检索它以及如何访问它。我没有使用AzureDataLake存储。(几乎我发现与Azure相关的每个链接都指向某个数据湖链接)我的hdfs-site.xml:dfs.webhdfs.enabledtrue核心站点.xml:fs.defaultFSwasb://@.blob.core.windows.nettrue 最佳答案您的基本webHDFS文件系统URI应该是:webhdfs:/

HDInsight webHDFS section code gt azure hadoop azure-hdinsight

azure - 有没有办法获取 hadoop HDInsight 节点的图像/快照并将它们用于集群创建？

我想拍摄我的HDInsighthadoop集群的图像/快照，因为我已经在我的节点上配置了驱动程序和一些实用程序。我如何拍摄快照并将其用于集群创建以复制相同的配置。最佳答案目前，没有为HDInsight集群拍摄图像/快照的选项。如果您的集群处于事件状态，您将产生费用。要停止产生费用，推荐的方法是在不使用时删除集群。为了实现这一点，您可以尝试:您可以使用AzurePowerShell和自动化来尝试。有关详细信息，请参阅“自动配置HDInsightClusterswithPowerShellandAzureAutomation”.”您

并将 HDInsight section noreferrer azure hadoop cluster-computing snapshot azure-hdinsight

hadoop - Kafka Connect HDFS 接收器与 Azure Blob 存储

我想使用KafkaHDFS接收器连接器连接到AzureBlob存储。到目前为止我已经做了:设置kafka-connect属性:hdfs.url=wasbs://hadoop.conf.dir={hadoop_3_home}/etc/hadoop/hadoop.home={hadoop_3_home}并且在core-site.xml中添加了对wasbs的支持:fs.wasbs.implorg.apache.hadoop.fs.azure.NativeAzureFileSystem导出HADOOP_CLASSPATH变量，添加到PATH但是无论如何，Hadoop找不到类-NativeAzu

Connect hadoop code section apache-kafka azure-blob-storage apache-kafka-connect

azure - 从本地机器访问 azure vm 中的 spark docker

Sparkdocker安装在azurevm(centos7.2)中，我想从我的本地机器(Windows)访问hdfs。我在Windows中运行curl-i-v-Lhttp://52.234.XXX.XXX:50070/webhdfs/v1/user/helloworld.txt?op=OPEN，异常是$curl-i-v-Lhttp://52.234.XXX.XXX:50070/webhdfs/v1/user/helloworld.txt?op=OPEN*timeoutonnamelookupisnotsupported*Trying52.234.XXX.XXX...*TCP_NODEL

azure docker code overruns dropped hadoop apache-spark ifconfig

azure - 域加入 HdInsight 集群 hdfs 用户权限

我已经创建了一个加入域的HdInsight集群。这在允许我的activedirector中的用户使用他们的AD凭据登录到集群方面非常有效。但是，似乎并没有限制用户访问各种文件/目录的方法。用户1对用户2的文件具有完全访问权限，反之亦然。我最初的希望是使用Ranger为各种用户/组配置HDFS权限-但是，考虑到后端的blob存储，这似乎不太可能。我也尝试过使用诸如“hadoopfs-chown”之类的命令来设置用户/组/其他权限，但是，当通过ssh进入集群(头节点)时，所有用户似乎都可以为所欲为。这是预期的行为吗？有没有办法限制用户访问HDFS上的各种目录？不幸的是，在后端使用Azure

HdInsight azure section stackoverflow hadoop hdfs azure-hdinsight ambari

103 104 105106107 108 109