AZURE

azure - Pig 无法在 HDFS (riskfactor.pig) 中创建(或查找)pigjobs 文件

我在Azure上使用HortonWorks沙箱，并且正在研究Hadoop入门教程“实验室3-pig风险因素分析”。http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_5在执行完所有步骤之后，运行这个pig脚本:a=LOAD'geolocation'usingorg.apache.hive.hcatalog.pig.HCatLoader();b=filterabyevent!='normal';c=foreachbgenera

中创 riskfactor apache hadoop java azure apache-pig hdfs hortonworks-data-platform

azure - 将日期转换为星期日期名称和一天的一部分

那么我如何使用以下输入从pig那里得到这个输出。我应该使用哪些命令输入:10/3/2013120010/4/20130000预期输出:MondayMorningTuesdayEvening 最佳答案将字段拆分为2个字段，然后使用ToDate获取当天的名称。对于晚上和早上，您可以检查值并分配。假设您与1个字段有关系B=FOREACHAGENERATESTRSPLIT((chararray)A.$0,'',2);C=FOREACHBGENERATEToString(ToDate(B.$0,'MM/dd/yyyy'),'E'),(CAS

azure 日期 section 39 code hadoop apache-pig

azure - 如何为 Premium HDInsight 创建反向 DNS 查找区域？

我已经在Azure中创建了一个DNS区域。例如，对于IP范围192.0.2.128/26，我创建了128-26.2.0.192.in-addr.arpa。现在我应该如何为要创建的Hdinsight虚拟机创建PTR记录？最佳答案当为具有192.0.2.128/26前缀中的IP的主机创建反向区域以托管记录时，区域名称将通过隔离地址的网络前缀(192.0.2)然后反转顺序来创建(2.0.192)并添加后缀.in-addr.arpa。关于azure-如何为PremiumHDInsight创

反向何为 section strong azure hadoop azure-hdinsight reverse-dns apache-ranger

powershell - JWT token 的安全 token 验证错误 -- HDInsight

我创建了一个新的存储帐户并在WindowsAzure上配置了一个HDInsight集群。但是，当我尝试在与集群相关的WindowsAzurePowershell上运行任何命令时，出现以下错误:PSC:\>Get-AzureHDInsightCluster-Name$clusterNameGet-AzureHDInsightCluster:Requestfailedwithcode:UnauthorizedContent:AuthenticationFailedAsecuritytokenvalidationerroroccuredforthereceivedJWTtoken.Atlin

token powershell section Get-AzureHDInsightCluster windowsazure azure hadoop apache-pig azure-hdinsight

Azure 上的 Node.js 和 HBase (HDInsight)

我正在尝试从Node.js访问MicrosoftAzure上的HBase。我查看了不同的库，例如hbase和RESTAPI(webhcat)。我想要实现的是创建一个表并从Node.js上传数据。稍后我想对该数据集进行查询。不幸的是，Azure的文档在这方面没有太大帮助，因为它侧重于PowerShell和.NETSDK。我发现的一篇非常有用的文章是:http://blogs.msdn.com/b/bigdatasupport/archive/2014/04/22/querying-hdinsight-job-status-with-webhcat-via-native-powershel

HDInsight Azure section https noreferrer node.js hadoop hbase azure-hdinsight

regex - 文件名的一部分作为 Hive 表中的列

我想将文件名的第一部分作为Hive表中的一列Myfilenameis:20151102114450.46400_Always_1446482638967.xml我在MicrosoftAzure的Hive中使用正则表达式编写了一个查询(查询下方)以获取它的第一部分，即20151102114450但是当我运行查询时，我得到的输出为20151102164358selectCAST(regexp_replace(regexp_replace(regexp_replace(CAST(CAST(regexp_replace(split(INPUT__FILE__NAME,'[_]')[2],'.x

regex Hive 39 section code azure hadoop hiveql

azure - hadoop集群，datanode无法运行，排除0个节点

我正在Azure的Hadoop中创建一个多节点(1主和3从)集群，我认为所有的设置都已经完成，但是当我运行一个测试文件时，它遇到了与Stackoverflow中其他人类似的问题，我已经尝试了他们的解决方案，但是，这个问题仍然无法解决。谁能帮助我，我在这个问题上卡了几天org.apache.hadoop.ipc.RemoteException(java.io.IOException):File/benchmarks/TestDFSIO/io_control/in_file_test_io_0couldonlybereplicatedto0nodesinsteadofminReplicat

datanode hadoop apache java azure hadoop2

hadoop - 如何配置和重新启动在 Azure 上运行的 HDInsight 群集？

具体来说，我想更改在MicrosoftAzure上运行的HDInsight集群中每个节点的最大映射器数量和最大缩减器数量。我使用远程桌面登录到头节点。我编辑了头节点上的mapred-site.xml文件并更改了mapred.tasktracker.map.tasks.maximum和mapred.tasktracker.reduce.tasks.maximum值。我尝试重新启动头节点，但无法重新启动。我使用start-onebox.cmd和stop-onebox.cmd脚本来尝试启动/停止HDInsight。然后我运行了一个流式mapreduce，将所需数量的reducer传递给had

HDInsight hadoop section mapred cluster-computing configure reboot azure-hdinsight

azure - 在 HDInsight 上使用 HQL 文件时出现 ParseExceptions

我正在学习本教程http://azure.microsoft.com/en-us/documentation/articles/hdinsight-use-hive/但是在将查询源更改为使用文件时卡住了。使用New-AzureHDInsightHiveJobDefinition-Query$queryString时一切正常但是当我尝试New-AzureHDInsightHiveJobDefinition-File"/example.hql"与example.hql存储在blob容器的“根”中，我得到ExitCode40000和标准错误中的以下内容:Logginginitializedu

时出 ParseExceptions section code azure hadoop hive azure-hdinsight

Azure HDInsight : what is head node in a hadoop cluster?

我刚刚在HDInsight中设置了一个Hadoop集群并尝试开始使用Hadoop。我在集群上启用了远程登录并登录到它。我已将要处理的数据从我的桌面复制到这个盒子上。文档将此框称为头节点，并有一个额外的步骤，用于讨论将数据复制到hadoop集群。这让我很困惑。我有以下问题:当我将数据从桌面复制到我登录的盒子时，它实际上不是将数据复制到hadoop吗？第一个复制操作与第二个复制操作有何不同？什么是Hadoop中的头节点？最佳答案 HDInsight集群中的头节点是运行构成Hadoop平台的一些服务的机器，包括名称节点和作业跟踪器。从广

HDInsight cluster section Hadoop azure azure-hdinsight

49 50 515253 54 55