我正在开发文件管理 Windows 应用程序。该程序应保留磁盘上所有文件和文件夹的路径数组。例如:
0 "C:"
1 "C:\abc"
2 "C:\abc\def"
3 "C:\ghi"
4 "C:\ghi\readme.txt"
“原样”的数组将非常大,因此应该将其压缩并存储在磁盘上。但是,我想随机访问它:
RetrievePath(2) = "C:\abc\def")IndexOf("C:\ghi") = 3)AddPath("C:\ghi\xyz\file.dat")1 "C:\abc" 并且仍然有 4 "C:\ghi\readme.txt"。 有人可以建议一些好的算法/数据结构/想法来做这些事情吗?
编辑:
目前我想出了以下解决方案:
0 "C:"
1 "[0]\abc"
2 "[1]\def"
3 "[0]\ghi"
4 "[3]\readme.txt"
即公共(public)前缀被压缩。
RetrievePath(2) = "[1]\def"= RetrievePath(1) + "\def"= "[0]\abc\def"= RetrievePath(0) + "\abc\def"= "C:\abc\def" IndexOf() 也可以迭代工作,类似这样:
IndexOf("C:") = 0
IndexOf("C:\abc") = IndexOf("[0]\abc") = 1
IndexOf("C:\abc\def") = IndexOf("[1]\def") = 2
要添加新路径,比如 AddPath("C:\ghi\xyz\file.dat"),首先应该添加其前缀:
5 [3]\xyz
6 [5]\file.dat
重命名/移动文件/文件夹仅涉及一次替换(例如,将 [0]\ghi 替换为 [1]\klm 将重命名目录 "ghi" 到 "klm" 并将其移动到目录 "C:\abc")
DeletePath() 涉及将其(以及所有子路径)设置为空字符串。将来,它们可以被替换为新的路径。
在 DeletePath("C:\abc") 之后,数组将是:
0 "C:"
1 ""
2 ""
3 "[0]\ghi"
4 "[3]\readme.txt"
整个数组仍然需要加载到 RAM 中才能执行快速操作。例如,总共有 1000000 个文件和文件夹,平均文件名长度为 10,则该数组将占用超过 10 MB。
此外,函数 IndexOf() 被迫按顺序扫描数组。
编辑 (2):我刚刚意识到我的问题可以重新表述:
我如何为磁盘上的每个文件和每个文件夹分配唯一的整数索引,以便我能够通过索引快速找到文件/文件夹,已知文件/文件夹的索引,并执行基本的文件操作而无需更改许多索引?
编辑 (3): Here是一个关于类似但与 Linux 相关的问题。建议使用文件名和内容哈希来识别文件。是否有一些特定于 Windows 的改进?
最佳答案
您的解决方案似乎不错。您还可以尝试使用临时技巧来压缩更多内容,例如仅对常见字符(如“\”)、驱动器号、可能是常见文件扩展名等使用一些位。您还可以查看尝试 ( http://en.wikipedia.org/wiki/Trie)。
关于您的第二次编辑,这似乎符合哈希表的特征,但这是用于索引,而不是压缩存储。
关于windows - 压缩的文件路径数组和随机访问,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12185961/
我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,
我需要在客户计算机上运行Ruby应用程序。通常需要几天才能完成(复制大备份文件)。问题是如果启用sleep,它会中断应用程序。否则,计算机将持续运行数周,直到我下次访问为止。有什么方法可以防止执行期间休眠并让Windows在执行后休眠吗?欢迎任何疯狂的想法;-) 最佳答案 Here建议使用SetThreadExecutionStateWinAPI函数,使应用程序能够通知系统它正在使用中,从而防止系统在应用程序运行时进入休眠状态或关闭显示。像这样的东西:require'Win32API'ES_AWAYMODE_REQUIRED=0x0
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题
对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚
我的代码目前看起来像这样numbers=[1,2,3,4,5]defpop_threepop=[]3.times{pop有没有办法在一行中完成pop_three方法中的内容?我基本上想做类似numbers.slice(0,3)的事情,但要删除切片中的数组项。嗯...嗯,我想我刚刚意识到我可以试试slice! 最佳答案 是numbers.pop(3)或者numbers.shift(3)如果你想要另一边。 关于ruby-多次弹出/移动ruby数组,我们在StackOverflow上找到一