azure-devops

azure - 使用 NiFi 从 Azure 到 Google Cloud Platform 的数据流

我的目标是使用NiFi将json/xml文件从Azure移动到GoogleCloudPlatform(GCP)>。在我所有的研发之后，我发现了一些可能有用的处理器。列表如下:获取文件放置文件putGCSObject-将数据放入GCPFoundthislinkasanalternativetogetfilesfromAzuresincethereisnoin-builtprocessoravailable上面的链接很复杂。所以根据我的目标，我走对了吗？我需要额外的处理器吗？？以及在定义此流程时我需要进行的任何重要配置？请帮助我，因为我是新手并且刚刚开始使用NiFi

azure - 如何连接 Azure 机器学习和 Spark Streaming 或 Apache Storm

是否有可能将流从SparkStreaming或ApacheStorm获取到Azure机器学习中？在reader选项中有一个从Hive数据库读取数据的输入但是如何从Spark或Storm获取实时数据流，例如实时欺诈检测最佳答案我理解使用开源Storm或Spark来做到这一点的愿望。但我也想提供100%Azure解决方案，因为就我个人而言，我发现它是使用流数据快速完成许多“简单”事情的好方法。首先，我们有服务总线，它可以包含事件中心。事件中心是一个管理良好的队列，可以在其中将数据事件流式传输到云中。queue有暂停，rewind功能

Streaming Apache section strong Spark azure hadoop cortana-intelligence azure-machine-learning-studio

azure - pipemapred waitoutputthreads 子进程失败，代码为 255

我正在AzureHDInsight(Hadoop)上运行一个简单的Map/Reduce作业。映射器失败并出现以下错误(来自JobTracker日志)...2014-03-2716:42:50,330INFOorg.apache.hadoop.mapred.TaskInProgress:Errorfromattempt_201403262112_0004_m_000000_0:java.lang.RuntimeException:PipeMapRed.waitOutputThreads():subprocessfailedwithcode255atorg.apache.hadoop.st

waitoutputthreads pipemapred hadoop apache code azure mapreduce streaming azure-hdinsight

azure - 从 Azure HDInsight 迁移到 Amazon EMR？

需要大数据专家的帮助。我们目前已经开始构建一个具有大数据需求的产品，并且我们选择了Hadoop。我们目前在大数据方面没有太多经验。对于我们的云平台和Hadoop，我们试图在AzureHDInsight和AmazonAWSEMR之间做出选择。我们的产品将使用.Net构建，我们已经将Azure用于另一个现有产品。我们也有使用AWS的经验，但还没有使用Hadoop。现在，我们知道Azure不如EMR成熟，而AWS会是更好的选择，至少在未来几年是这样。但是，使用.Net在Azure上进行开发可能会更容易，并且还可以节省一些前期成本，因为我们已经在使用它。因此，我们正在考虑在Azure上构建产品

HDInsight Amazon section Azure hadoop amazon-web-services azure-hdinsight

azure - hdinsight pig 作业提交 502 错误

我在将pig作业提交到hdinsight集群时收到502错误。关于如何修复集群的任何想法？上次出现此错误时，我删除了集群并重新创建了它，想找到一种更好的方法来修复该错误。这是我得到的错误:Microsoft.WindowsAzure.Management.HDInsight.Framework.Core.Library.WebRequest.HttpLayerException:Requestfailedwithcode:BadGatewayContent:502-Webserverreceivedaninvalidresponsewhileactingasagatewayorprox

hdinsight azure CompilerServices TaskAwaiter Runtime hadoop apache-pig azure-hdinsight

azure - SLF4J : Class path contains multiple SLF4J bindings on azure hdinsight

我已经创建了一个配置单元外部表来访问hbase表，方法是遵循HBase-HiveIntegrationanswer.下面是我创建外部表的配置单元查询:CREATEEXTERNALTABLEhive_tweets_by_message_words_key(keyINT,dSTRING)STOREDBY'org.apache.hadoop.hive.hbase.HBaseStorageHandler'WITHSERDEPROPERTIES("hbase.columns.mapping"=":key,d:d")TBLPROPERTIES("hbase.table.name"="tweets_

azure SLF4J SLF4 section hadoop hive hbase azure-hdinsight

azure - 如何在 hdfs 中启用校验和值？

如何在hdfs中启用校验和值。在azure的hdinsight集群顶部使用hadoop(Hadoop2.7.3)。我尝试使用此命令检查校验和值:-hadoopfs-checksum/filename.txt然后校验和值为NONE。阅读here“通常的校验和是‘无’。所以我的问题是如何启用校验和值？最佳答案请尝试在AzureHDInsight上为HDFS命令。hadoopfs-checksumwasbs://containername@xxxx.blob.core.windows.net/folder/filename.txt

何在 azure section hadoop code hdfs azure-hdinsight

azure - HDInsight 和 Talend Open Studio for Big Data

我目前正在开展一个项目，我需要将TalendopenStudioforBigData(v6.3.1)连接到Azure的HDInsight(3.5)Hadoop集群。到目前为止，我正在尝试一个简单的例子，它包括创建一个Hive表。为此，我使用了下图:配置单元连接配置如下:...请在下面找到tHiveCreateTable_1节点的规范:通过运行这个过程:·创建了指定的容器和部署Blob(见下图)——这让我相信Windows存储配置一切正常·但是tHiveCreateTable_1节点有错误(见下图)·我坚信它与主机名和端口有关；·我尝试使用集群的主机名和我们可以在Ambari中找到的Hi

HDInsight Talend image noreferrer noopener azure hadoop hive azure-hdinsight

azure - Azure 上的 Hadoop，我可以为 I/O 使用不同的 Blob 存储容器吗？

我目前正在从事一个在Azure上创建大数据架构的项目。为了了解Azure的工作原理，我创建了数据工厂和Blob存储，并在按需HDInsight系统上为字数统计Hadoop进程设置了管道。这是管道的JSON文件:{"name":"MRSamplePipeline5","properties":{"description":"SamplePipelinetoRuntheWordCountProgram","activities":[{"type":"HDInsightMapReduce","typeProperties":{"className":"wordcount","jarFileP

容器 Hadoop 34 cnauroth Azure

azure - 我在 Azure HDInsight 上的 webHDFS url 是什么？

这里是azure的新手。我刚刚在常规存储帐户上启动了一个新的HDInsight实例和一个新的存储实例。我想知道我的webHDFS网址是什么/我可以在哪里检索它以及如何访问它。我没有使用AzureDataLake存储。(几乎我发现与Azure相关的每个链接都指向某个数据湖链接)我的hdfs-site.xml:dfs.webhdfs.enabledtrue核心站点.xml:fs.defaultFSwasb://@.blob.core.windows.nettrue 最佳答案您的基本webHDFS文件系统URI应该是:webhdfs:/

HDInsight webHDFS section code gt azure hadoop azure-hdinsight

132 133 134135136 137 138