azure-devops

azure - 有没有办法获取 hadoop HDInsight 节点的图像/快照并将它们用于集群创建？

我想拍摄我的HDInsighthadoop集群的图像/快照，因为我已经在我的节点上配置了驱动程序和一些实用程序。我如何拍摄快照并将其用于集群创建以复制相同的配置。最佳答案目前，没有为HDInsight集群拍摄图像/快照的选项。如果您的集群处于事件状态，您将产生费用。要停止产生费用，推荐的方法是在不使用时删除集群。为了实现这一点，您可以尝试:您可以使用AzurePowerShell和自动化来尝试。有关详细信息，请参阅“自动配置HDInsightClusterswithPowerShellandAzureAutomation”.”您

并将 HDInsight section noreferrer azure hadoop cluster-computing snapshot azure-hdinsight

hadoop - Kafka Connect HDFS 接收器与 Azure Blob 存储

我想使用KafkaHDFS接收器连接器连接到AzureBlob存储。到目前为止我已经做了:设置kafka-connect属性:hdfs.url=wasbs://hadoop.conf.dir={hadoop_3_home}/etc/hadoop/hadoop.home={hadoop_3_home}并且在core-site.xml中添加了对wasbs的支持:fs.wasbs.implorg.apache.hadoop.fs.azure.NativeAzureFileSystem导出HADOOP_CLASSPATH变量，添加到PATH但是无论如何，Hadoop找不到类-NativeAzu

Connect hadoop code section apache-kafka azure-blob-storage apache-kafka-connect

azure - 从本地机器访问 azure vm 中的 spark docker

Sparkdocker安装在azurevm(centos7.2)中，我想从我的本地机器(Windows)访问hdfs。我在Windows中运行curl-i-v-Lhttp://52.234.XXX.XXX:50070/webhdfs/v1/user/helloworld.txt?op=OPEN，异常是$curl-i-v-Lhttp://52.234.XXX.XXX:50070/webhdfs/v1/user/helloworld.txt?op=OPEN*timeoutonnamelookupisnotsupported*Trying52.234.XXX.XXX...*TCP_NODEL

azure docker code overruns dropped hadoop apache-spark ifconfig

azure - 域加入 HdInsight 集群 hdfs 用户权限

我已经创建了一个加入域的HdInsight集群。这在允许我的activedirector中的用户使用他们的AD凭据登录到集群方面非常有效。但是，似乎并没有限制用户访问各种文件/目录的方法。用户1对用户2的文件具有完全访问权限，反之亦然。我最初的希望是使用Ranger为各种用户/组配置HDFS权限-但是，考虑到后端的blob存储，这似乎不太可能。我也尝试过使用诸如“hadoopfs-chown”之类的命令来设置用户/组/其他权限，但是，当通过ssh进入集群(头节点)时，所有用户似乎都可以为所欲为。这是预期的行为吗？有没有办法限制用户访问HDFS上的各种目录？不幸的是，在后端使用Azure

HdInsight azure section stackoverflow hadoop hdfs azure-hdinsight ambari

azure - 将 Azure blob 与 Hadoop 结合使用时配置 defaultFS

我们正在尝试将azureblob存储与Hadoop结合使用。问题是我们必须在core-site.xml中设置fs.defaultFS属性，但在我们的例子中，我们收到了一个错误。文件和错误都在下面给出:fs.AbstractFileSystem.wasb.implorg.apache.hadoop.fs.azure.Wasbfs.azure.account.key.OUR_STORAGE_ACCOUNT.blob.core.windows.net"OUR_KEY"fs.defaultFSwasb://blob-hdfs@OUR_STORAGE_ACCOUNT.blob.core.wind

用时 defaultFS code section azure hadoop hdfs azure-blob-storage

c# - Hadoop on Azure 示例生成空白文件

AzureC#流式处理示例教程中的Hadoop我正在尝试这个。我在我的帐户上安装了示例代码，然后当我尝试执行输出后的作业时，我得到并在一天结束时生成了一个空白文件。有时甚至没有生成。以下是我在屏幕上看到的内容:有没有人遇到过这种类型的问题？最佳答案我的集群是在11月29日创建的。Microsoft在THISLINK上发布了与hadoop相关的BUG所以我确实重新创建了我的集群，然后我的问题就解决了。即使是SAMPLES中给出的基本示例，当天也不起作用。所以现在一切都很好..非常感谢。

c#Hadoop section stackoverflow image azure hadoop-streaming

c# - 在 MapReduce 中使用 Windows Azure 存储执行 Reduce 函数后无法看到最终结果

我正在使用c#.net编写map和reduce函数。我基本上遵循给出的示例here最终命令Hadoopjarhadoop-streaming.jar-files"hdfs:///example/apps/map.exe,hdfs:///example/apps/reduce.exe"-input"/example/apps/data.csv"-output"/example/apps/output.txt"-mapper"map.exe"-reducer"reduce.exe"作业成功运行现在从交互式JS模式，如果我写js>#cat/example/apps/output.txtcat

c#MapReduce code example output hadoop azure-storage hadoop-streaming

azure - 无法将 Azure Blob 文件加载到 HDINSIGHT 中的 Hive 表中

我是Hadoop新手，我陷入了一个基本问题，即只将单个blob文件数据加载到配置单元表中。我正在根据文件名emp.dat创建表。CREATEEXTERNALTABLEEmployee(IDint,managerstring,Codeint,Namestring,Yearint,Monthint,Salaryint,Ageint)ROWFORMATDELIMITEDFIELDSTERMINATEDBY'\t'STOREDASTEXTFILELOCATION'wasb://practice@XXXblobstore.blob.core.windows.net/emp.dat/'当我执行上面

HDINSIGHT azure section code XXXblobstore hadoop hive hiveql azure-hdinsight

azure - Hbase扫描命令到windows中的文本文件

是否可以捕获hbase命令“扫描表”到文本文件。命令是这样的:hbase(main):001:0>scansampletable我尝试使用命令提示符命令hbase(main):001:0>scansampletable>textfile.txt但给出错误“参数数量错误”我也尝试了以下命令:hbase(main):001:0>echo"scan'sampletable'"|hbaseshell|grep"^">registration.txt但是命令中出现异常“无法识别的字符^” 最佳答案您不能在hbaseshell中执行linux

本文 windows section hbase code azure hadoop azure-hdinsight

azure - 需要多少个 Hive 动态分区？

我正在运行一项大型工作，将两年内不定期的大约55个样本流(标签)(每条记录一个样本)合并为15分钟的平均值。原始数据集中的23k条流中大约有11亿条记录，这55条流约占这些记录的3300万条。我计算了一个15分钟的索引并按它分组以获得平均值，但是尽管将它提高到20k，我似乎已经超过了我的配置单元作业的最大动态分区。我想我可以进一步增加它，但它已经需要一段时间才能失败(大约6小时，虽然我通过减少要考虑的流的数量将它减少到2)，而且我实际上不知道如何计算我真正有多少需要。代码如下:SEThive.exec.dynamic.partition=true;SEThive.exec.dynami

azure Hive apache hadoop azure-hdinsight

133 134 135136137 138 139