草庐IT

azure-databricks

全部标签

c# - 在 Azure 中以编程方式创建 HBase 表

我发现可以使用Blob存储在Azure中配置HBase数据库。有谁知道我如何使用c#代码访问、创建项目并将项目添加到我的blob存储中的HBase?我之后尝试的是在HDInsight集群上使用Hive从HBase查询数据。干杯,乔 最佳答案 我创建了Marlinproject就此而言,因为HDInsight上的HBase没有“官方”MicrosoftC#客户端。使用Marlin,您可以创建一个具有如下模式的表:varmarlin=newMarlin(ClusterCredentials.FromFile("credentials.t

azure - 使用 ImportTsv 在 Azure 的 HBase 中加载文件时出错

尝试使用推荐的方法在MicrosoftAzure云中的HDInsight中运行的HBase中加载tsv文件,通过远程桌面连接并在命令行上运行尝试将t1.tsv文件(具有两个制表符分隔的列)从hdfs加载到hbaset1table:C:\apps\dist\hbase-0.98.0.2.1.5.0-2057-hadoop2\bin>hbaseorg.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.columns=HBASE_ROW_KEY,numt1t1.tsv并得到:错误:除了行键和时间戳(可选)之外,还需要一列或多列用法:impo

azure - hdinsight actionscript 安装 spark 1.2

有谁知道如何为hdisights创建ActionScript?我现在正在使用actoinscript安装spark1.0.2,但希望集群上的spark1.2.x获得更多的配置单元支持。我读过ScriptActionDevelopmentwithHDInsight当我尝试通过修改Microsoft提供的actionscript使用1.2创建spark集群时。这样做之后我得到一个错误,spark不理解文件url'wasb://'并且它需要采用'hdfs://'格式。在文章中它谈到了ConfigurethecustomcomponentstouseWASB它说:Thecustomcompon

powershell - 无法使用 Azure powershell 执行 pig 脚本

这是我的Pig脚本$QueryString="A=load'wasb://$containername@$StorageAccount.blob.core.windows.net/table1'usingPigStorage(',')as(col1chararray,col2chararray,col3chararray,col4chararray,col5chararray,col6chararray,col7int,col8int);"+"user_list=foreachAGENERATE$0;"+"unique_user=DISTINCTuser_list;"+"unique_

azure - 如何将数据上传到 HDInsight 中的 Hive?

我正在尝试将blob数据从Azureblob存储上传到Hive表,该表具有以下格式保存在名为myblob_test.csv的.csv文件中:以下脚本用于创建表:CREATETABLEIFNOTEXISTSAzureData.Events(DaySTRING,Event_TypeSTRING,Time_StampSTRING)ROWFORMATDELIMITEDFIELDSTERMINATEDBY','LINESTERMINATEDBY'\n'STOREDASTEXTFILELOCATION'/bigdatapoc1/azure-data-2/myblob_test.csv';我的文件保

azure - Cloudera - 启动服务 - NameNode 未格式化

我在Miscrosoftazure上安装了Cloudera集群。我每个周末都按照以下步骤关闭集群:1)ClouderaManager的ClouderaManagementService转2)停止ClouderaManager的所有服务3)转到名称节点并运行命令:servicecloudera-scm-serverstop4)关闭集群上的虚拟机。当我尝试启动这个集群时,我遵循以下步骤:1)启动集群上的虚拟机2)服务“cloudera-scm-server”在启动时已经启动。3)从CM开启Cloudera管理服务4)开启所有服务。这是它失败的地方,并向我提供了它无法启动名称节点的错误,因为

azure - HDInsight 客户端缺少库

我们有在Azure上运行的HDInsight集群。我试图创建一个客户端机器来连接到HDInsight。我按照Hortonworks安装指南中的说明安装所有客户端组件,然后将/etc/hadoop/conf从一个HDInsight节点复制到这个新节点。但是当我尝试通过hadoopfs-ls访问集群时,出现以下错误root@sbd-docker:~#hadoopfs-ls/log4j:ERRORCouldnotinstantiateclass[com.microsoft.log4jappender.EtwAppender].java.lang.ClassNotFoundException:

Azure oozie 工作流

我正在尝试在azurehdinsight集群上运行oozie工作流,作业定义如下所示:jobtrackerhost:9010wasb://abc@def.blob.core.windows.netmapred.job.queue.namedefaultimport--connectjdbc:mysql://{ip}/svnadmin--usernameuname--passwordpassword--tablerights--hive-importsqoopfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]日志:201

hadoop - 将数据从 Hadoop(本地)加载到 Azure Data Lake 的不同方法

我需要每8小时将数据从Hadoop(这是本地Hortonworks集群)加载到AzureDataLake。你能告诉我——在实现解决方案时可以尝试哪些不同的方法吗?ADF[我们可以创建管道事件并安排它们]还要别的吗?谢谢,亚拉汶 最佳答案 我们在thislink提供了高级选项.搜索:“存储在本地或IaaSHadoop集群中的数据”。但是,需要根据以下方面进行微调:1.您要移动多少数据、文件数量、文件大小等。较小的文件将需要更长的时间来传输。2.从本地到Azure的网络连接如果您有ExpressRoute可用,您将获得更好的体验。如果您

postgresql - Microsoft Azure HDInsight Ambari Sqoop 和 Postgres

尝试将数据从postgres导入MicrosoftAzureHDInsigt上的hdfs。如果列出dbs,现在我从一个非常简单的命令开始sqooplist-databases--connectjdbc.postgresql://xx.xxx.xxx.xxx:yyyy--usernamemyuser--passwordmypassword我得到以下错误ERRORtool.BaseSqoopTool:Goterrorcreatingdatabasemanager:java.io.IOException:Nomanagerforconnectstring:jdbc.postgresql://