为什么在 Random.java 中选择了 181783497276652981 和 8682522807148012?
以下是 Java SE JDK 1.7 的相关源代码:
/**
* Creates a new random number generator. This constructor sets
* the seed of the random number generator to a value very likely
* to be distinct from any other invocation of this constructor.
*/
public Random() {
this(seedUniquifier() ^ System.nanoTime());
}
private static long seedUniquifier() {
// L'Ecuyer, "Tables of Linear Congruential Generators of
// Different Sizes and Good Lattice Structure", 1999
for (;;) {
long current = seedUniquifier.get();
long next = current * 181783497276652981L;
if (seedUniquifier.compareAndSet(current, next))
return next;
}
}
private static final AtomicLong seedUniquifier
= new AtomicLong(8682522807148012L);
因此,在没有任何种子参数的情况下调用 new Random() 会获取当前的“种子唯一性”并与 System.nanoTime() 进行异或。然后它使用 181783497276652981 创建另一个种子唯一标识符,以便在下次调用 new Random() 时存储。
文字 181783497276652981L 和 8682522807148012L 没有放在常量中,但它们不会出现在其他任何地方。
起初,评论给了我一个简单的线索。在线搜索该文章可得到 the actual article . 8682522807148012 没有出现在论文中,但 181783497276652981 确实出现了——作为另一个数字的子字符串,1181783497276652981,即 181783497276652981 前面带有 1。
该论文声称 1181783497276652981 是一个可以为线性同余生成器产生良好“优点”的数字。这个数字是否只是错误地复制到 Java 中? 181783497276652981 有可接受的优点吗?
为什么选择8682522807148012?
在线搜索任何一个号码都没有解释,只有 this page这也注意到 181783497276652981 前面的 1 被丢弃。
是否可以选择与这两个数字一样有效的其他数字?为什么或为什么不?
最佳答案
Was this number simply mis-copied into Java?
是的,好像打错了。
Does 181783497276652981 have an acceptable merit?
这可以使用论文中介绍的评估算法来确定。但是“原始”数字的优点可能更高。
And why was 8682522807148012 chosen?
似乎是随机的。可能是编写代码时 System.nanoTime() 的结果。
Could other numbers have been chosen that would have worked as well as these two numbers?
并非每个数字都同样“好”。所以,没有。
JRE 的不同版本和实现之间的默认种子模式存在差异。
public Random() { this(System.currentTimeMillis()); }
public Random() { this(++seedUniquifier + System.nanoTime()); }
public Random() { this(seedUniquifier() ^ System.nanoTime()); }
如果您连续创建多个 RNG,则第一个是 Not Acceptable 。如果它们的创建时间落在相同的毫秒范围内,它们将给出完全相同的序列。 (相同的种子 => 相同的序列)
第二个不是线程安全的。多个线程在同时初始化时可以获得相同的 RNG。此外,后续初始化的种子往往是相关的。根据系统的实际计时器分辨率,种子序列可以线性增加(n,n+1,n+2,...)。如 How different do random seeds need to be? 中所述和引用论文Common defects in initialization of pseudorandom number generators , 相关种子可以在多个 RNG 的实际序列之间产生相关性。
第三种方法创建随机分布的不相关种子,甚至跨线程和后续初始化。 所以当前的 java 文档:
This constructor sets the seed of the random number generator to a value very likely to be distinct from any other invocation of this constructor.
可以通过“跨线程”和“不相关”进行扩展
但种子序列的随机性仅与底层 RNG 一样好。 此 java 实现中用于种子序列的 RNG 使用 c=0 和 m=2^64 的乘法线性同余生成器 (MLCG)。 (模数 2^64 由 64 位长整数溢出隐式给出) 由于零 c 和模数 2 的幂,“质量”(周期长度、比特相关性……)是有限的。正如论文所说,除了总周期长度之外,每个位都有自己的周期长度,对于不太重要的位,周期长度会呈指数下降。因此,较低位具有较小的重复模式。 (seedUniquifier() 的结果应该是位反转的,在实际 RNG 中被截断为 48 位之前)
但它很快!并且为了避免不必要的比较和设置循环,循环体应该很快。这可能解释了这种特定 MLCG 的用法,无需加法,无需异或,只需一次乘法。
并且上述论文提供了 c=0 和 m=2^64 的良好“乘数”列表,如 1181783497276652981。
总而言之:努力@JRE-developers ;) 但是有一个错字。 (但谁知道呢,除非有人评估,否则有可能缺失的前导1实际上提高了种子RNG。)
但有些乘数肯定更糟: “1”导致一个恒定的序列。 “2”导致单比特移动序列(以某种方式相关) ...
RNG 的序列间相关性实际上与 (Monte Carlo) 模拟相关,其中多个随机序列被实例化甚至并行化。因此,一个好的播种策略对于获得“独立”模拟运行是必要的。因此,C++11 标准引入了 Seed Sequence 的概念。用于生成不相关的种子。
关于java - 随机(Java 7)中的 181783497276652981 和 8682522807148012 是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18092160/
总的来说,我对ruby还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题
我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何
为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返