草庐IT

compression

全部标签

java - 如何解压缩 lzo_deflate 文件?

我使用LZO来压缩reduce输出。我试过这个:Hadoop-LZOprojectofKevinWeil然后在我的工作中使用LzoCodec类:TextOutputFormat.setOutputCompressorClass(job,LzoCodec.class);现在压缩工作正常。我的问题是压缩结果是一个.lzo_deflate文件,我无法解压。Lzoputility似乎不支持那种类型的文件。LzopCodec应该提供一个.lzo文件,但它没有工作,但是它与LzoCodec在同一个包中(org.apache.hadoop.io.compress)这可能是指兼容性问题,因为我使用旧的

configuration - 为 Hive 中的 INSERT OVERWRITE SELECT 指定压缩编解码器

我有一个像这样的hive表CREATETABLEbeacons(foostring,barstring,foonotbarstring)COMMENT"Digestofdailybeacons,byday"PARTITIONEDBY(daystringCOMMENt"InYYYY-MM-DDformat");为了填充,我正在做类似的事情:SEThive.exec.compress.output=True;SETio.seqfile.compression.type=BLOCK;INSERTOVERWRITETABLEbeaconsPARTITION(day="2011-01-26")S

compression - Hadoop:在 HDFS 中压缩文件?

我最近在Hadoop中设置了LZO压缩。在HDFS中压缩文件的最简单方法是什么?我想压缩一个文件,然后删除原来的。我应该使用IdentityMapper和使用LZO压缩的IdentityReducer创建MR作业吗? 最佳答案 对我来说,编写HadoopStreaming的开销较低压缩文件的作业。这是我运行的命令:hadoopjar$HADOOP_HOME/contrib/streaming/hadoop-streaming-0.20.2-cdh3u2.jar\-Dmapred.output.compress=true\-Dmapr

compression - 关于 Hadoop 和压缩输入文件的非常基本的问题

我已经开始研究Hadoop。如果我的理解是正确的,我可以处理一个非常大的文件,它会被拆分到不同的节点上,但是如果文件被压缩,那么文件就无法拆分,需要由单个节点处理(有效地破坏了在并行机集群上运行mapreduce)。我的问题是,假设以上是正确的,是否可以将大文件手动拆分为固定大小的block或每日block,压缩它们,然后传递压缩输入文件列表以执行mapreduce? 最佳答案 BZIP2在hadoop中是可拆分的-它提供了非常好的压缩率,但从CPU时间和性能来看并没有提供最佳结果,因为压缩非常消耗CPU。LZO在hadoop中是可

php - zlib.output_compression 和 output_buffering

我可以通过将zlib.output_compression指令设置为on来压缩输出,然后将output_buffering指令设置为off?其次,我读到我可以为指定特定缓冲区大小的zlib.output_compression指令设置一个数值。但是,如果我也将output_buffering指令设置为不同的字节数怎么办?最大缓冲区大小是多少? 最佳答案 是的,您可以通过这种方式压缩PHP输出,但是网络服务器(nginx、Apache)可以对所有类型的内容(cssAssets等)进行更有效的压缩,而不仅仅是PHP输出:)是的,您可以将

php - 编码/压缩重复整数序列

我有很长的整数序列,看起来像这样(任意长度!):0000000001110002220033333现在我需要一些算法来将这个字符串转换成类似压缩的东西a9b3a3c3a2d5表示“a9次,然后b3次,然后a3次”等等,其中“a”代表0,“b”代表1,“c”代表2,“d”代表3。你会怎么做?到目前为止,我还没有想到合适的东西,我也没有用谷歌搜索,因为我真的不知道要搜索什么。这种编码/压缩叫什么?PS:我将使用PHP进行编码,并使用JavaScript进行解码。编辑:谢谢大家!我最终得到了这个编码函数:protectedfunctionnumStringToRle($s){$rle='';

php - 使用 php 脚本压缩/存档文件夹

有没有办法使用php脚本将服务器中的文件夹压缩/存档为.zip或.rar或任何其他压缩格式,以便根据要求我们可以存档文件夹,然后提供下载链接提前致谢 最佳答案 这是一个例子:open('my-archive.zip',ZIPARCHIVE::CREATE)!==TRUE){die("Couldnotopenarchive");}//initializeaniterator//passitthedirectorytobeprocessed$iterator=newRecursiveIteratorIterator(newRecursi

c# - 在 c# 中解压由 php 的 gzcompress() 压缩的字符串

我正在查询c#4.0中的网络服务,它为我提供了一个由php的gzcompress()压缩的字符串.现在我需要在C#中解压缩这个字符串。我尝试了几种方法,包括GZipStreamdecompressionperformanceispoorC#toJava:Base64String,MemoryStream,GZipStreamHowtosolveGzipMagicNumberMissing但每次我都会收到“缺少魔数(MagicNumber)”异常。有人可以给我一些提示吗?谢谢编辑1:我最近的尝试:publicstaticstringDecompress(stringcompressed)

php - 使用 PHP 列出 .7z、.rar 和 .tar 文件中的文件

我想列出存档中的文件,不提取。我感兴趣的文件类型:.7z(7-Zip).rar(WinRAR).tar(POSIX,例如GNUtar)。.zip(ISO标准,例如WinZip)For.zipfiles,我已经能够做到这一点:open('theZip.zip');for($i=0;$inumFiles;$i++){$stat=$za->statIndex($i);print_r(basename($stat['name']).PHP_EOL);}?>但是,我还没有设法对.7z文件执行相同的操作。尚未测试.rar和.tar,但也需要它们。 最佳答案

php - 在 PHP 中压缩字符串的最佳方法

这个问题在这里已经有了答案:WhichcompressionmethodtouseinPHP?(3个答案)关闭8年前。我正在使用gzcompress(json_encode($arr),9)压缩数组。所以我使用json_encode将数组转换为字符串,然后使用gzcompress进行压缩。但是我找不到结果字符串大小的太大差异。压缩前大小为488KB,压缩后大小为442KB。有什么方法可以进一步压缩字符串吗?提前致谢。