azure-databricks

azure - 通过 Web UI 或跨平台 CLI 创建示例 Azure Hadoop 作业？

我正在尝试使用HDInsight在Azure上使用Hadoop，但对如何在我新创建的集群上运行Hadoop作业感到有点困惑。到目前为止，我已经创建了一个HDInsight群集并为其附加了一个存储帐户。我还在我的本地OSX机器上安装了azure-cli。有一个AzuretutorialonlaunchingHadoopjobs，但它使用PowerShell，我认为它不能通过Azurecross-platformCLI获得.除了启动WindowsVirtualBox之外，是否可以通过AzureWebUI(例如像AmazonEMR提供的那样)或通过一些其他与OSX兼容的命令行参数来创建作业？

azure - Azure Data Lakes (Hadoop) 中的优先级和并行值意味着什么？

换句话说，并行度值为5和优先级值为1000是什么意思？最佳答案它们会影响您的作业运行的方式和时间。优先级确定作业相对于其他排队作业的运行顺序，并行性设置为其启动的并行进程数(更多意味着它运行得更快但成本更高)https://learn.microsoft.com/en-us/azure/data-lake-analytics/data-lake-analytics-manage-use-portal优先级Lowernumberhashigherpriority.Iftwojobsarebothqueued,theonewithl

意味着 Hadoop section strong blockquote azure azure-data-lake u-sql

entity-framework - Azure Hadoop 和 Entity Framework

我说的是一个需要可移植的新项目，在某些情况下将有上亿个实体。现在随着Azure获得hadoop，这当然引起了我对大数据场景的关注。但是我也有100万行以下的小数据场景。EntityFrameworkcode-first是我看到的设计方式，但当然需要混合使用hadoop可能会使事情复杂化(EntityFramework当然用于为较小的数据集提供更简单的存储提供程序)现在的问题是有人有这方面的经验吗？任何人都可以推荐这是否是一个好方法，如果不是，还有更好的方法吗？最佳答案在基于EntityFrameworkCodeFirst的相当大

entity-framework Framework section 的 hadoop

azure - Spark 壳错误 : No FileSystem for scheme: wasb

我们在Azure中运行HDInsight集群，但它不允许在创建集群时启动边缘/网关节点。所以我通过安装创建了这个边缘/网关节点echo'debhttp://private-repo-1.hortonworks.com/HDP/ubuntu14/2.x/updates/2.4.2.0HDPmain'>>/etc/apt/sources.list.d/HDP.listecho'debhttp://private-repo-1.hortonworks.com/HDP-UTILS-1.1.0.20/repos/ubuntu14HDP-UTILSmain'>>/etc/apt/sources.l

FileSystem scheme code hadoop spark azure azure-hdinsight hdpi

ubuntu - Ping 不适用于 Azure 上的 ubuntu 虚拟机

我在azure上创建了2个ubuntu虚拟机，我可以使用“sshazureuser@xyz.cloudapp.net”从一台机器登录到另一台机器，但是从另一台虚拟机ping一个虚拟机没有响应。与curl相同。pingxyz.cloudapp.netcurlxyz.cloudapp.net用虚拟机的内部ip地址修改/etc/hosts文件也不起作用。最佳答案 ICMP(Ping)在Azure中被阻止，因此根据设计这将失败。您可以根据您设置网络的方式以及您尝试ping的方式使它起作用。参见https://social.msdn.mic

ubuntu Azure section ICMP hadoop

azure - Hadoop 和 Druid 与 Jackson 库的不兼容问题

我在具有HDPinsight2.4.1.1-3的Azure集群上运行druid0.9.0。hadoop客户端是2.7.1。经过无数次尝试解决jackson的问题，具体来说:Error:classcom.fasterxml.jackson.datatype.guava.deser.HostAndPortDeserializeroverridesfinalmethoddeserialize.我已经尝试了这里记录的所有解决方法https://github.com/druid-io/druid/blob/master/docs/content/operations/other-hadoop.m

Jackson Hadoop code java azure druid

c# - 提交 C# MapReduce 作业 Windows Azure HDInsight - 响应状态代码不表示成功 : 500 (Server Error)

我正在尝试将MapReduce作业提交到HDInsight集群。在我的工作中，我没有写减少部分，因为我不想减少任何东西。我想要做的就是解析每个文件名并将值附加到文件中的每一行。这样我就可以在文件中获得所需的所有数据。我的代码是usingMicrosoft.Hadoop.MapReduce;usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Text;usingSystem.Threading.Tasks;namespaceGetMetaDataFromFileName{classProgram

c#string 34 fileMetaData azure hadoop mapreduce azure-hdinsight

azure - Hive是否有动态枢轴功能

Hive是否具有动态数据透视功能？我能够找到常规的枢轴(即here)，但它们似乎是硬编码的枢轴(所有值在运行时已知)而不是动态的(所有值在运行时确定)。如果它存在或有人可以分享用户定义的代码，我们将不胜感激。最佳答案 HiveQL不支持您描述的动态数据透视表。如果你想做这样的事情，你需要使用直接的动态SQL并在你使用的任何编排工具中构建查询。我没用过，但这显然是supportedinHPL/SQLthroughuseoftheEXECkeyword.这将允许执行动态SQL字符串，并在传统Hive之上提供一个更具事务性的层。HPL/

枢轴 azure section noreferrer hadoop hive pivot hql

使用 Azure DevOps 的 Kubernetes 部署

Kubernetes是一个开源容器编排平台，用于管理和自动化容器化应用程序的部署、扩展和管理。AzureDevOps是一种基于云的DevOps服务，可为构建、测试和部署应用程序提供完整的CI/CD管道。在本文中，我将讨论如何使用AzureDevOps部署Kubernetes应用程序。先决条件Azure订阅一个AzureDevOps帐户一个Kubernetes集群一个Docker镜像第1步：创建Kubernetes部署文件在源代码存储库中创建Kubernetes部署文件(deployment.yaml)。此文件应包含Kubernetes部署的规范，包括容器映像、副本和端口。这是部署文件的示例：a

Kubernetes DevOps Azure 云计算 Kubernete

php - 如何添加到 Azure Web 服务上的 PHP.ini？

我正在尝试按照本教程进行操作:https://www.drupal.org/node/2481341第二步说:在全局PHP级别，将curl.cainfo=[enteryourpath]\cacert.pem添加到您的php.ini。如何将此行添加到我的Azure应用服务中当前的php.ini文件？最佳答案按照以下步骤更改PHP_INI_SYSTEM配置设置-使用键PHP_INI_SCAN_DIR和值d:\home\site\ini将应用设置添加到您的Web应用使用Kudu控制台(http://.scm.azurewebsite.

Azure php section ini https initialization azure-web-app-service