azure-databricks

c# - 在 Azure 中以编程方式创建 HBase 表

我发现可以使用Blob存储在Azure中配置HBase数据库。有谁知道我如何使用c#代码访问、创建项目并将项目添加到我的blob存储中的HBase？我之后尝试的是在HDInsight集群上使用Hive从HBase查询数据。干杯，乔最佳答案我创建了Marlinproject就此而言，因为HDInsight上的HBase没有“官方”MicrosoftC#客户端。使用Marlin，您可以创建一个具有如下模式的表:varmarlin=newMarlin(ClusterCredentials.FromFile("credentials.t

c#Azure section testTableSchema HBase hadoop azure-blob-storage

azure - 使用 ImportTsv 在 Azure 的 HBase 中加载文件时出错

尝试使用推荐的方法在MicrosoftAzure云中的HDInsight中运行的HBase中加载tsv文件，通过远程桌面连接并在命令行上运行尝试将t1.tsv文件(具有两个制表符分隔的列)从hdfs加载到hbaset1table:C:\apps\dist\hbase-0.98.0.2.1.5.0-2057-hadoop2\bin>hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.columns=HBASE_ROW_KEY,numt1t1.tsv并得到:错误:除了行键和时间戳(可选)之外，还需要一列或多列用法:impo

时出中加 section hbase HBASE_ROW_KEY azure hadoop azure-hdinsight

azure - hdinsight actionscript 安装 spark 1.2

有谁知道如何为hdisights创建ActionScript？我现在正在使用actoinscript安装spark1.0.2，但希望集群上的spark1.2.x获得更多的配置单元支持。我读过ScriptActionDevelopmentwithHDInsight当我尝试通过修改Microsoft提供的actionscript使用1.2创建spark集群时。这样做之后我得到一个错误，spark不理解文件url'wasb://'并且它需要采用'hdfs://'格式。在文章中它谈到了ConfigurethecustomcomponentstouseWASB它说:Thecustomcompon

actionscript hdinsight section spark noreferrer azure hadoop apache-spark hdfs azure-hdinsight

powershell - 无法使用 Azure powershell 执行 pig 脚本

这是我的Pig脚本$QueryString="A=load'wasb://$containername@$StorageAccount.blob.core.windows.net/table1'usingPigStorage(',')as(col1chararray,col2chararray,col3chararray,col4chararray,col5chararray,col6chararray,col7int,col8int);"+"user_list=foreachAGENERATE$0;"+"unique_user=DISTINCTuser_list;"+"unique_

powershell Azure apache PigServer java hadoop apache-pig azure-hdinsight

azure - 如何将数据上传到 HDInsight 中的 Hive？

我正在尝试将blob数据从Azureblob存储上传到Hive表，该表具有以下格式保存在名为myblob_test.csv的.csv文件中:以下脚本用于创建表:CREATETABLEIFNOTEXISTSAzureData.Events(DaySTRING,Event_TypeSTRING,Time_StampSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY','LINESTERMINATEDBY'\n'STOREDASTEXTFILELOCATION'/bigdatapoc1/azure-data-2/myblob_test.csv';我的文件保

传到 HDInsight image noreferrer section azure hadoop hive hiveql azure-hdinsight

azure - Cloudera - 启动服务 - NameNode 未格式化

我在Miscrosoftazure上安装了Cloudera集群。我每个周末都按照以下步骤关闭集群:1)ClouderaManager的ClouderaManagementService转2)停止ClouderaManager的所有服务3)转到名称节点并运行命令:servicecloudera-scm-serverstop4)关闭集群上的虚拟机。当我尝试启动这个集群时，我遵循以下步骤:1)启动集群上的虚拟机2)服务“cloudera-scm-server”在启动时已经启动。3)从CM开启Cloudera管理服务4)开启所有服务。这是它失败的地方，并向我提供了它无法启动名称节点的错误，因为

Cloudera NameNode section azure hadoop hdfs

azure - HDInsight 客户端缺少库

我们有在Azure上运行的HDInsight集群。我试图创建一个客户端机器来连接到HDInsight。我按照Hortonworks安装指南中的说明安装所有客户端组件，然后将/etc/hadoop/conf从一个HDInsight节点复制到这个新节点。但是当我尝试通过hadoopfs-ls访问集群时，出现以下错误root@sbd-docker:~#hadoopfs-ls/log4j:ERRORCouldnotinstantiateclass[com.microsoft.log4jappender.EtwAppender].java.lang.ClassNotFoundException:

HDInsight azure java apache org hadoop hdfs azure-hdinsight

Azure oozie 工作流

我正在尝试在azurehdinsight集群上运行oozie工作流，作业定义如下所示:jobtrackerhost:9010wasb://abc@def.blob.core.windows.netmapred.job.queue.namedefaultimport--connectjdbc:mysql://{ip}/svnadmin--usernameuname--passwordpassword--tablerights--hive-importsqoopfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]日志:201

Azure oozie lt gt hadoop sqoop azure-hdinsight

hadoop - 将数据从 Hadoop(本地)加载到 Azure Data Lake 的不同方法

我需要每8小时将数据从Hadoop(这是本地Hortonworks集群)加载到AzureDataLake。你能告诉我——在实现解决方案时可以尝试哪些不同的方法吗？ADF[我们可以创建管道事件并安排它们]还要别的吗？谢谢，亚拉汶最佳答案我们在thislink提供了高级选项.搜索:“存储在本地或IaaSHadoop集群中的数据”。但是，需要根据以下方面进行微调:1.您要移动多少数据、文件数量、文件大小等。较小的文件将需要更长的时间来传输。2.从本地到Azure的网络连接如果您有ExpressRoute可用，您将获得更好的体验。如果您

hadoop section Azure azure-data-lake

postgresql - Microsoft Azure HDInsight Ambari Sqoop 和 Postgres

尝试将数据从postgres导入MicrosoftAzureHDInsigt上的hdfs。如果列出dbs，现在我从一个非常简单的命令开始sqooplist-databases--connectjdbc.postgresql://xx.xxx.xxx.xxx:yyyy--usernamemyuser--passwordmypassword我得到以下错误ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanager:java.io.IOException:Nomanagerforconnectstring:jdbc.postgresql://

postgresql Microsoft apache Sqoop azure hadoop azure-hdinsight

101 102 103104105 106 107