草庐IT

azure-cloud-services

全部标签

Docker Service 创建

DockerSwarmModeDockerSwarm集群搭建DockerSwarm节点维护DockerService创建service只能依附于dockerswarm集群,所以service的创建前提是,swarm集群搭建完毕。1.创建servicedockerservicecreate命令用于创建service,需要在manager中运行。与创建容器的命令dockerrun非常类似目前的节点状态如下:在swarm中创建一个运行tomcat:8.5.49镜像的service,服务名称为toms,包含3个副本task,对外映射端口号为9000。当一个service包含多个task时,对servi

azure - 如何从 C# 中自动化 Azure Spark?

我可以创建集群,但我该如何自动执行脚本?varclusterInfo=newClusterCreateParametersV2{Name=clusterConfig.ClusterName,...ClusterType=ClusterType.Spark};`cluster.RunScript()?我可以获得SparkContext吗?https://azure.microsoft.com/en-us/documentation/articles/hdinsight-apache-spark-use-bi-tools/ 最佳答案 今

azure - Pig 无法在 HDFS (riskfactor.pig) 中创建(或查找)pigjobs 文件

我在Azure上使用HortonWorks沙箱,并且正在研究Hadoop入门教程“实验室3-pig风险因素分析”。http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_5在执行完所有步骤之后,运行这个pig脚本:a=LOAD'geolocation'usingorg.apache.hive.hcatalog.pig.HCatLoader();b=filterabyevent!='normal';c=foreachbgenera

amazon-web-services - 如何使用 "s3a://"方案让 Hive 2.2.1 成功与 AWS S3 集成

我遵循了各种已发布的文档,了解如何使用s3a://方案将ApacheHive2.1.1与AWSS3集成,配置fs.s3a.access.key和fs.s3a.secret.key用于hadoop/etc/hadoop/core-site.xml和hive/conf/hive-site.xml.我现在可以让hdfsdfs-lss3a://[bucket-name]/正常工作(它返回那个桶的s3ls)。所以我知道我的信用、存储桶访问和整体Hadoop设置是有效的。hdfsdfs-lss3a://[bucket-name]/drwxrwxrwx-hdfshdfs02017-06-2722:4

azure - 将日期转换为星期日期名称和一天的一部分

那么我如何使用以下输入从pig那里得到这个输出。我应该使用哪些命令输入:10/3/2013120010/4/20130000预期输出:MondayMorningTuesdayEvening 最佳答案 将字段拆分为2个字段,然后使用ToDate获取当天的名称。对于晚上和早上,您可以检查值并分配。假设您与1个字段有关系B=FOREACHAGENERATESTRSPLIT((chararray)A.$0,'',2);C=FOREACHBGENERATEToString(ToDate(B.$0,'MM/dd/yyyy'),'E'),(CAS

amazon-web-services - Hadoop 配置单元无法在 AWS EMR 上扩展

我正在hadoophive上运行一个实验。在这个实验中,我在2个不同的硬件设置上运行相同的配置单元作业。它托管在AWSEMR中。这是我运行的hive.sql脚本:DROPDATABASEIFEXISTSlabtest;CREATEDATABASElabtest;CREATETABLEIFNOTEXISTSlaborder(InserttsTIMESTAMP,ordernrSTRING,PatientnrSTRING,visitnrSTRING)ROWFORMATSERDE'org.apache.hadoop.hive.serde2.OpenCSVSerde'WITHSERDEPROPE

azure - 如何为 Premium HDInsight 创建反向 DNS 查找区域?

我已经在Azure中创建了一个DNS区域。例如,对于IP范围192.0.2.128/26,我创建了128-26.2.0.192.in-addr.arpa。现在我应该如何为要创建的Hdinsight虚拟机创建PTR记录? 最佳答案 当为具有192.0.2.128/26前缀中的IP的主机创建反向区域以托管记录时,区域名称将通过隔离地址的网络前缀(192.0.2)然后反转顺序来创建(2.0.192)并添加后缀.in-addr.arpa。 关于azure-如何为PremiumHDInsight创

Azure 上的 Node.js 和 HBase (HDInsight)

我正在尝试从Node.js访问MicrosoftAzure上的HBase。我查看了不同的库,例如hbase和RESTAPI(webhcat)。我想要实现的是创建一个表并从Node.js上传数据。稍后我想对该数据集进行查询。不幸的是,Azure的文档在这方面没有太大帮助,因为它侧重于PowerShell和.NETSDK。我发现的一篇非常有用的文章是:http://blogs.msdn.com/b/bigdatasupport/archive/2014/04/22/querying-hdinsight-job-status-with-webhcat-via-native-powershel

hadoop - 将 hadoop 集群连接到多个 Google 项目中的多个 Google Cloud Storage 存储桶

可以同时将我的Hadoop集群连接到多个GoogleCloud项目吗?我可以通过GoogleCloudStorageConnector在单个GoogleProject中轻松使用任何GoogleStorage存储桶,如本线程中所述Migrating50TBdatafromlocalHadoopclustertoGoogleCloudStorage.但是我找不到任何文档或示例如何从单个map-reduce作业连接到两个或多个GoogleCloud项目。你有什么建议/技巧吗?非常感谢。 最佳答案 确实,可以同时将您的集群连接到来自多个不同

hadoop - 使用 Google Cloud Dataflow 合并 Google Cloud Storage 中的文件

NathanMarz在他的书“BigData”中描述了如何维护HDFS中的数据文件。以及如何使用他的Pail优化文件大小以尽可能接近原生HDFSblock大小在MapReduce之上运行的库.是否有可能在GoogleCloudStorage中获得相同的结果??我可以使用GoogleCloudDataflow吗?而不是MapReduce用于此目的? 最佳答案 GoogleCloudStorage允许组合对象,让您可以将一个对象存储在多个部分中,然后将它们组合起来,一次最多可组合32个部分,总共1024个组成部分。API中提供了此功能。