草庐IT

docker-elastic

全部标签

hadoop - docker 中的 yarn - __spark_libs__.zip 不存在

我浏览了thisStackOverflow帖子,但它们对我帮助不大。我正在尝试让Yarn在现有集群上运行。到目前为止,我们一直在使用sparkstandalonemanger作为我们的资源分配器,它一直按预期工作。这是我们架构的基本概述。白框中的所有内容都在docker容器中运行。从master-machine我可以从yarn资源管理器容器中运行以下命令并运行一个使用yarn的spark-shell:./pyspark--masteryarn--驱动程序内存1G--executor-memory1G--executor-cores1--conf"spark.yarn.am.memory

【1】Docker详解与部署微服务实战

Docker详解Docker简介Docker是一个开源的容器化平台,可以帮助开发者将应用程序和其依赖的环境打包成一个可移植、可部署的容器。Docker的主要目标是通过容器化技术实现应用程序的快速部署、可移植性和可扩展性,从而简化应用程序的开发、测试和部署过程。容器化是一种虚拟化技术,它通过在操作系统层面隔离应用程序和其依赖的运行环境,使得应用程序可以在一个独立的、封闭的环境中运行,而不受底层操作系统和硬件的影响。与传统的虚拟机相比,容器化具有以下优势:轻量级容器与宿主机共享操作系统内核,因此容器本身非常轻量级,启动和停止速度快,资源占用少。可移植性容器可以在任何支持相应容器运行时的系统上运行,

初识docker

初识docker1.安装dockersudoapt-getupdate&&sudoapt-getinstall-yapt-transport-httpsca-certificatescurlsoftware-properties-common&&curl-fsSLhttps://download.docker.com/linux/ubuntu/gpg|sudoapt-keyadd-&&sudoadd-apt-repository"deb[arch=amd64]http://mirrors.aliyun.com/docker-ce/linux/ubuntu$(lsb_release-cs)sta

hadoop - 随着集群规模的增加,每个节点并发运行的映射器数量在 Elastic MapReduce w/AMI 3.1.0 和 Hadoop 2.4.0 上急剧下降

在相关问题(HowtosettheprecisemaxnumberofconcurrentlyrunningtaskspernodeinHadoop2.4.0onElasticMapReduce)中,我要求提供将并发运行的映射器/缩减器的数量与YARN和MR2内存参数相关联的公式。事实证明,在ElasticMapReduce上,当我的集群有2到10个c3.2xlarge节点时,那里提到的公式的变体工作正常,每个节点有7-9个并发运行的映射器;但是当c3.2xlarges的数量为20或40时,我发现集群未充分利用:每个节点仅运行1-4个映射器。由于我的工作受CPU限制,这尤其糟糕:MR2

python - 使用 elastic-mapreduce 将文件加载到 EMR 分布式缓存时出错

我正在使用以下命令启动集群。./elastic-mapreduce--create\--stream\--caches3n://bucket_name/code/totalInstallUsers#totalInstallUsers\--inputs3n://bucket_name/input\--outputs3n://bucket_name/output\--mappers3n://bucket_name/code/mapper.py\--reducers3n://bucket_name\--jobflow-roleEMR_EC2_DefaultRole\--service-rol

hadoop - 如何向 Elastic Search 数据库添加计算?

我正在使用ElasticSearch为大量传感器数据编制索引以用于分析目的。该表有超过400万行并且增长迅速-预计明年将达到4000万。这使得ElasticSearch看起来很自然,尤其是使用Kibana等工具可以轻松显示数据。ElasticSearch看起来很棒,但是还必须执行一些更复杂的计算。一种这样的计算是针对我们的“平均用户时间”,我们在其中获取两个数据点(元素拾取的时间戳和元素放回的时间戳),将它们相互减去,然后对一个特定客户的所有这些进行平均具体时间范围。SQL查询看起来像“select*fromeventswhereevent_type='objectpickedup'o

4.docker容器编排(docker compose 与 docker swarm)

本文目录1.容器编排2.DockerCompose1.DockerCompose安装2.DockerCompose示例1.使用docker-compose启动nginx2.dockercompose常用命令3.校验docker-compose.yml是否有错误4.创建服务,启动容器5.弹性伸缩3.DockerSwarm1.Swarm架构图2.Swarm节点说明3.Swarm集群部署1.了解dockerswarm命令2.初始化集群3.work节点加入集群4.查看swarm集群节点信息4.部署服务命令5.部署服务6.弹性伸缩缩容7.节点离开swarm集群8.删除离开的节点9.离开的节点,再次加入s

java - Docker 和 Cloudera 快速入门 : How to run own jar-file?

我安装了Docker容器并进行了后续步骤:dockerpullcloudera/quickstart:latestdockerimages#notethehashoftheimageandsubstituteitbelowdockerrun--privileged=true\--hostname=quickstart.cloudera\-t-i${HASH}\/usr/bin/docker-quickstart所以,现在我知道了:Cloudera正在运行。但是我看不到任何本地文件,那么如何加载我自己的文件,尤其是jar文件以使用Hadoop运行它? 最佳答案

hadoop - 如何在 Docker 容器中挂载 HDFS

我在Docker容器中制作了一个应用程序Dockerized。我打算让应用程序能够从我们的HDFS访问文件。Docker镜像将部署在我们通过Marathon-Mesos安装HDFS的同一集群上。以下是要POST到Marathon的json。看来我的应用程序能够在HDFS中读取和写入文件。有人可以评论这个的安全性吗?我的应用程序更改的文件是否也会在HDFS中正确更改?我用Google搜索了一下,没有找到任何类似的方法...{"id":"/ipython-test","cmd":null,"cpus":1,"mem":1024,"disk":0,"instances":1,"contain

docker - Hadoop用docker运行 "hdfs dfs -put"错误

我有一个hadoop的docker镜像。(在我的例子中是https://github.com/kiwenlau/hadoop-cluster-docker)我是按照这个博客一步步做的。而且我可以成功运行docker和Hadoop。但是,当我尝试将一些文件放入hostmachine以测试Hadoop中的WordCount测试时。当我运行时root@hadoop-master:~#hdfsdfs-put/home/ke/code/input它返回一个错误:put:`/home/ke/code':Nosuchfileordirectory但是这个目录确实存在,因为我可以使用cd/home/k