azure-virtual-machine

azure - 如何将数据上传到 HDInsight 中的 Hive？

我正在尝试将blob数据从Azureblob存储上传到Hive表，该表具有以下格式保存在名为myblob_test.csv的.csv文件中:以下脚本用于创建表:CREATETABLEIFNOTEXISTSAzureData.Events(DaySTRING,Event_TypeSTRING,Time_StampSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY','LINESTERMINATEDBY'\n'STOREDASTEXTFILELOCATION'/bigdatapoc1/azure-data-2/myblob_test.csv';我的文件保

传到 HDInsight image noreferrer section azure hadoop hive hiveql azure-hdinsight

azure - Cloudera - 启动服务 - NameNode 未格式化

我在Miscrosoftazure上安装了Cloudera集群。我每个周末都按照以下步骤关闭集群:1)ClouderaManager的ClouderaManagementService转2)停止ClouderaManager的所有服务3)转到名称节点并运行命令:servicecloudera-scm-serverstop4)关闭集群上的虚拟机。当我尝试启动这个集群时，我遵循以下步骤:1)启动集群上的虚拟机2)服务“cloudera-scm-server”在启动时已经启动。3)从CM开启Cloudera管理服务4)开启所有服务。这是它失败的地方，并向我提供了它无法启动名称节点的错误，因为

Cloudera NameNode section azure hadoop hdfs

azure - HDInsight 客户端缺少库

我们有在Azure上运行的HDInsight集群。我试图创建一个客户端机器来连接到HDInsight。我按照Hortonworks安装指南中的说明安装所有客户端组件，然后将/etc/hadoop/conf从一个HDInsight节点复制到这个新节点。但是当我尝试通过hadoopfs-ls访问集群时，出现以下错误root@sbd-docker:~#hadoopfs-ls/log4j:ERRORCouldnotinstantiateclass[com.microsoft.log4jappender.EtwAppender].java.lang.ClassNotFoundException:

HDInsight azure java apache org hadoop hdfs azure-hdinsight

hadoop - 您如何找到 Splice Machine 的文档？

如何找到有关SpliceMachine的文档？最佳答案文档位于http://doc.splicemachine.com.要使用开源，请参阅https://github.com/splicemachine/spliceengine下的README.md 关于hadoop-您如何找到SpliceMachine的文档？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/38776452

Machine hadoop section splicemachine noreferrer

Azure oozie 工作流

我正在尝试在azurehdinsight集群上运行oozie工作流，作业定义如下所示:jobtrackerhost:9010wasb://abc@def.blob.core.windows.netmapred.job.queue.namedefaultimport--connectjdbc:mysql://{ip}/svnadmin--usernameuname--passwordpassword--tablerights--hive-importsqoopfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]日志:201

Azure oozie lt gt hadoop sqoop azure-hdinsight

hadoop - 将数据从 Hadoop(本地)加载到 Azure Data Lake 的不同方法

我需要每8小时将数据从Hadoop(这是本地Hortonworks集群)加载到AzureDataLake。你能告诉我——在实现解决方案时可以尝试哪些不同的方法吗？ADF[我们可以创建管道事件并安排它们]还要别的吗？谢谢，亚拉汶最佳答案我们在thislink提供了高级选项.搜索:“存储在本地或IaaSHadoop集群中的数据”。但是，需要根据以下方面进行微调:1.您要移动多少数据、文件数量、文件大小等。较小的文件将需要更长的时间来传输。2.从本地到Azure的网络连接如果您有ExpressRoute可用，您将获得更好的体验。如果您

hadoop section Azure azure-data-lake

postgresql - Microsoft Azure HDInsight Ambari Sqoop 和 Postgres

尝试将数据从postgres导入MicrosoftAzureHDInsigt上的hdfs。如果列出dbs，现在我从一个非常简单的命令开始sqooplist-databases--connectjdbc.postgresql://xx.xxx.xxx.xxx:yyyy--usernamemyuser--passwordmypassword我得到以下错误ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanager:java.io.IOException:Nomanagerforconnectstring:jdbc.postgresql://

postgresql Microsoft apache Sqoop azure hadoop azure-hdinsight

java - 来自 spark 本地的 Azure 特定读取文件

我正在为Azurewasbonspark苦苦挣扎我正在阅读从磁盘加载一个.json.gz文件并将其加载到hdfs。我在其他系统上广泛使用了以下代码。valfile_a_raw=sqlContext.read.json('/home/users/repo_test/file_a.json.gz')但是，在Azure上，这会返回:java.io.FileNotFoundException:Filewasb://server-2017-03-07t08-13-41-314z@server.blob.core.windows.net/home/users/repo_test/file_a.js

Azure spark code section java hadoop apache-spark

hadoop - SAP 沃拉 : Not able to add Vora table as Virtual table via Smart Data Access in HANA Studio

我正在使用带有HANAExpress2SP01的虚拟机。在一个小型测试集群上，我安装了HortonworksDataPlatform2.6和Spark1.6.3，还添加了HANAVora1.4和SparkController2.1。我遵循了SAPVora安装和管理指南:https://help.sap.com/http.svc/rc/f09ec811fe634f588647c342cac84c38/1.4/en-US/SAP_Vora_Installation_Admin_Guide_1.4_en.pdf直到第2.9章。一切正常，但Zeppelin部分与%jdbc解释器:%jdbcse

沃拉 table section Vora noreferrer hadoop hana apache-zeppelin hana-studio

hadoop - Hadoop 中的 VIRTUAL_MEMORY_BYTES 任务计数器是什么意思？

权威指南中的以下摘录提供了如下所示的高级详细信息，但是这个任务计数器中的虚拟内存到底指的是什么？如何解读？它与PHYSICAL_MEMORY_BYTES有什么关系？以下是其中一份工作的示例摘录。物理空间约为214GB。虚拟空间约为611GB。最佳答案 1.这个任务计数器中的虚拟内存到底指的是什么？VirtualMemoryhereisusedtopreventOutofMemoryerrorsofatask,ifdatasizedoesn'tfitsinRAM(physicalmem).inRAM.Soaportionofmemo

VIRTUAL_MEMORY_BYTES VIRTUAL section image noreferrer hadoop mapreduce hortonworks-data-platform apache-tez

134 135 136137138 139 140