草庐IT

zip_archive

全部标签

hadoop - 在 HDFS 中创建 zip 表

我试过创建不是这样的zip表。CREATETABLEexample_table(|aBIGINT,bBIGINT,vSTRING,dTINYINT)STOREDASTEXTFILELOCATION/path/to/directory/这不是压缩表。我还想用zip创建新表来获取该表的历史记录。我怎样才能用zip创建1个表? 最佳答案 首先设置下面的属性SEThive.exec.compress.output=true;SETmapred.output.compression.type=BLOCK;setmapred.output.co

hadoop - 在 Hadoop 映射中处理 Zip 文件

我是Hadoop和Mapreduce的新手。现在我需要使用Mapreduce处理myproject中的一个zip文件,比如输入必须是一个zip文件,输出可能是zip或文本文件。任何人都可以给我sample或建议我一个链接。谢谢,瓦拉丹.S 最佳答案 我目前还在研究Hadoop和Mapreduce。无需为Zip文件特别指定任何内容。hadoop会自动解压缩并处理它们。但是,输出是我正在使用的文本。我目前正在处理大量压缩文件,其中每个tar.gz文件都包含一个文本文件。问候巴拉拉姆 关于ha

Hadoop:每个 tar/zip 文件一个映射器

我有几个要计算统计信息的目录。即我的映射器函数将一个文件夹树作为输入,并根据目录及其所有子目录的内容吐出一些静态信息。每个目录的计算都需要很长时间。没有reducer。我可以为每个要处理的目录创建一个tar/zip文件,并将其复制到HDFS中。但是我如何确保为每个tar文件创建一个映射器并将tar文件的全部内容发送到该映射器(以便我可以遍历tar文件的内容并生成该文件的统计信息)?如果可能,我更愿意在HadoopStreaming中执行此操作。可以这样做吗? 最佳答案 我认为您在HDFS中有许多tar/zip文件作为您的map/re

hadoop - docker 中的 yarn - __spark_libs__.zip 不存在

我浏览了thisStackOverflow帖子,但它们对我帮助不大。我正在尝试让Yarn在现有集群上运行。到目前为止,我们一直在使用sparkstandalonemanger作为我们的资源分配器,它一直按预期工作。这是我们架构的基本概述。白框中的所有内容都在docker容器中运行。从master-machine我可以从yarn资源管理器容器中运行以下命令并运行一个使用yarn的spark-shell:./pyspark--masteryarn--驱动程序内存1G--executor-memory1G--executor-cores1--conf"spark.yarn.am.memory

hadoop map reduce -archives 不解压文件

希望你能帮助我。我有一个关于hadoopmap-reduce的令人头疼的问题。我一直在hadoop1.0.3版的map-reduce上成功使用“-files”选项。但是,当我使用“-archives”选项时,它会复制文件,但不会解压缩它们。我错过了什么?文档说“Archives(zip,tarandtgz/tar.gzfiles)areun-archivedattheslavenodes",但这不是我所看到的。我创建了3个文件-一个文本文件“alice.txt”、一个压缩文件“bob.zip”(包含b1.txt和bdir/b2.txt)和一个tar文件“claire.tar”(包含c1

MySQL 数据库归档工具pt-archive 与归档数据的安全存储 与 为什么每次归档都少数...

开头还是介绍一下群,如果感兴趣PolarDB,MongoDB,MySQL,PostgreSQL,Redis,Oceanbase,SqlServer等有问题,有需求都可以加群群内,可以解决你的问题。加群请联系liuaustin3,(共1780人左右1+2+3+4+5)4群(300+),另欢迎OpenGauss的技术人员加入。这里先做一个广告,在12月28日应邀,有异常分享活动,这里做一个广告DBA在日常的工作中,数据归档是DB人员工作中的必选项。这里有技术的因素和法律的因素,数据库中的业务在使用一段时间内,数据表中必然存在大量的过期的数据,这些数据将不在与当前的业务有关,同时这些数据的存在会影响

hadoop - 奥齐 : file and archive tag usage and differences?

在oozie模式中,java操作有两个标记,File和Archive。我想了解它们的用法?我还注意到这两个标签也应用于MR/pig操作。 最佳答案 关于文件和存档标签的快速描述:Thefile&archiveelementsmakeavailable,tomap-reducejobs,filesandarchives.Ifthespecifiedpathisrelative,itisassumedthefileorarchiverarewithintheapplicationdirectory,inthecorrespondings

python - 如何将带有依赖项的 python 脚本打包成 zip/tar?

我有一个hadoop集群,我正在使用Numpy、SciPy和Pandas进行数据分析。我希望能够使用命令的“--file”参数将我的hadoop作业作为zip/tar文件提交。该zip文件应该包含我的python程序需要执行的所有内容,这样无论我的脚本在集群中的哪个节点上执行,我都不会在运行时遇到ImportError。根据公司政策,在每个节点上安装这些库并不完全可行,尤其是对于探索性/敏捷开发。我确实安装了pip和virtualenv以根据需要创建沙箱。我看过zipimport和pythonpackaging但这些似乎都不能满足我的需求/我在使用这些工具时遇到困难。有没有人有幸做到这

php - 检查 ZIP 存档中内容的文件大小

我需要打开一个ZIP存档,检查存档中每个文件的文件大小并返回一个包含数值(大小)的数组。我可能不希望提取存档以检查文件大小。我自己尝试了很多,但似乎没有一个ZIP函数具有这样的功能,我想不出任何组合来自己编写函数。 最佳答案 我知道这个问题很老了。我希望这个答案可以帮助别人。下面的代码循环了test2.zip文件中的所有文件,并打印它的名称和大小(以字节为单位)。open('test2.zip');if($res){$i=0;while(!empty($zip->statIndex($i)['name'])){echo"Filena

IllegalStateException: Failed to get nested archive for entry 问题解决

一、问题描述与原因我遇到这个错误的原因是手动把jar包拖进目标jar包中,目标jar包是用压缩软件打开的:这样拖进去的后果就是,被拖进去的jar包时被压缩过的:下图红色方框jar是手动拖进去的,原始大小与压缩后大小不一样;绿色方框jar是之前在里面的jar包,原始大小与压缩后大小一样。二、解决办法:用jar命令把jar打包到目标jar包中:jar -uvf0目标jar包.jar  BOOT-INF\lib\被托的jar包.jar1、其中参数0是数字零,不是字母欧2、目标jar包.jar 所在的目录下需要建目录BOOT-INF\lib\自行看看jar命令帮助文档。