我有一个加密算法 (AES),它接受转换为数组字节的文件并对其进行加密。 由于我要处理一个非常大的文件,JVM 可能会内存不足。 我打算读取多个字节数组中的文件,每个字节数组包含文件的某些部分。然后我迭代地输入算法。最后,我将它们合并以生成一个加密文件。
所以我的问题是:有什么方法可以将一个文件逐个读取成多个字节数组吗?
我想我可以使用以下命令将文件读取为字节数组:
IOUtils.toByteArray(InputStream input).
然后使用以下方法将数组拆分为多个字节:
Arrays.copyOfRange()
但我担心将文件读取到 ByteArray 的代码会使 JVM 内存不足。
最佳答案
在 Java 中查找密码流。您可以使用它们即时加密/解密流,这样您就不必将整个内容存储在内存中。您所要做的就是将源文件的常规 FileInputStream 复制到 CipherOutputStream 中,该 CipherOutputStream 为加密的接收器文件包装您的 FileOutputStream。 IOUtils 甚至方便地包含一个 copy(InputStream, OutputStream) 方法来为您执行此复制。
例如:
public static void main(String[] args) {
encryptFile("exampleInput.txt", "exampleOutput.txt");
}
public static void encryptFile(String source, String sink) {
FileInputStream fis = null;
try {
fis = new FileInputStream(source);
CipherOutputStream cos = null;
try {
cos = new CipherOutputStream(new FileOutputStream(sink), getEncryptionCipher());
IOUtils.copy(fis, cos);
} finally {
if (cos != null)
cos.close();
}
} finally {
if (fis != null)
fis.close();
}
}
private static Cipher getEncryptionCipher() {
// Create AES cipher with whatever padding and other properties you want
Cipher cipher = ... ;
// Create AES secret key
Key key = ... ;
cipher.init(Cipher.ENCRYPT_MODE, key);
}
如果您需要知道复制的字节数,如果文件大小超过 Integer,您可以使用 字节 (2 GB)。IOUtils.copyLarge 而不是 IOUtils.copy .MAX_VALUE
要解密文件,执行相同的操作,但使用 CipherInputStream 而不是CipherOutputStream 并初始化您的Cipher 使用 Cipher.DECRYPT_MODE。
看看here有关 Java 中的密码流的更多信息。
这将为您节省空间,因为您不再需要存储自己的 byte 数组。此系统中唯一存储的 byte[] 是 Cipher 的内部 byte[],每次输入足够的输入时它都会被清除当 CipherOutputStream 关闭时,Cipher.update 或 Cipher.doFinal 返回一个加密 block 。但是,您不必担心任何这一切,因为这一切都是内部的,一切都为您管理。
编辑:请注意,这可能会导致某些加密异常被忽略,尤其是 BadPaddingException 和 IllegalBlockSizeException。此行为可以在 CipherOutputStream source code 中找到. (当然,这个来源来自 OpenJDK,但它可能在 Sun JDK 中做同样的事情。)另外,来自 CipherOutputStream java文档:
This class adheres strictly to the semantics, especially the failure semantics, of its ancestor classes
java.io.OutputStreamandjava.io.FilterOutputStream. This class has exactly those methods specified in its ancestor classes, and overrides them all. Moreover, this class catches all exceptions that are not thrown by its ancestor classes.
这里的粗线表示加密异常被忽略,它们确实是。这可能会在尝试读取加密文件时导致一些意外行为,尤其是对于 AES 等 block 和/或填充加密算法。请记住这一点,您将获得加密(或解密 CipherInputStream)文件的零输出或部分输出。
关于java - 将文件读取到多个字节数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13274388/
我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题
对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚
我的代码目前看起来像这样numbers=[1,2,3,4,5]defpop_threepop=[]3.times{pop有没有办法在一行中完成pop_three方法中的内容?我基本上想做类似numbers.slice(0,3)的事情,但要删除切片中的数组项。嗯...嗯,我想我刚刚意识到我可以试试slice! 最佳答案 是numbers.pop(3)或者numbers.shift(3)如果你想要另一边。 关于ruby-多次弹出/移动ruby数组,我们在StackOverflow上找到一
使用带有Rails插件的vim,您可以创建一个迁移文件,然后一次性打开该文件吗?textmate也可以这样吗? 最佳答案 你可以使用rails.vim然后做类似的事情::Rgeneratemigratonadd_foo_to_bar插件将打开迁移生成的文件,这正是您想要的。我不能代表textmate。 关于ruby-使用VimRails,您可以创建一个新的迁移文件并一次性打开它吗?,我们在StackOverflow上找到一个类似的问题: https://sta
我需要读入一个包含数字列表的文件。此代码读取文件并将其放入二维数组中。现在我需要获取数组中所有数字的平均值,但我需要将数组的内容更改为int。有什么想法可以将to_i方法放在哪里吗?ClassTerraindefinitializefile_name@input=IO.readlines(file_name)#readinfile@size=@input[0].to_i@land=[@size]x=1whilex 最佳答案 只需将数组映射为整数:@land边注如果你想得到一条线的平均值,你可以这样做:values=@input[x]