草庐IT

随机数

全部标签

python - 生成一个 10000 位的随机序列

有没有比在循环中附加0和1更有效的方法在Python中生成10kBit(10,000位)随机二进制序列? 最佳答案 如果您想要一个随机二进制序列,那么最快的方法可能是生成一个适当范围内的随机整数:importrandoms=random.randint(0,2**10000-1)在此之后,它真的取决于你想用你的二进制序列做什么。您可以使用按位运算查询单个位:s&(1或者您可以使用像bitarray这样的库或bitstring如果你想让检查、设置切片等更容易:frombitstringimportBitArrayb=BitArray(

python - 在 Pandas 数据框中随机插入 NA 的值

如何在DataFrame中随机插入np.nan?假设我想在我的DataFrame中包含10%的空值。我的数据是这样的:df=pd.DataFrame(np.random.randn(5,3),index=['a','b','c','d','e'],columns=['one','two','three'])onetwothreea0.6951321.044791-1.059536b-1.0751050.8257761.899795c-0.6789800.051959-0.691405d-0.1829281.455268-1.032353e0.2050940.714192-0.93824

python - PIP 随机失败 'Could not find a version that satisfies the requirement' 相同要求.txt

作为CI测试的一部分,我们安装了一个virtualenv,其中包含来自常量requirements.txt文件的一些pip包。由于requirements.txt文件未更改,此安装过程有时会随机失败,原因不明。并且每次都是针对不同的随机包。CI在AWS机器上,所以我认为这不是互联网问题失败看起来类似于(不同的包失败):Collectingdjango-rest-auth==0.9.3(from-rrequirements.txt(line7))Couldnotfindaversionthatsatisfiestherequirementdjango-rest-auth==0.9.3(f

python - 如何在 python 中读取/开发/随机

我在一本书上读到/dev/random就像一个无限大的文件,但是当我设置下面的代码来查看内容是什么样子时,它什么也没有打印。withopen("/dev/random")asf:foriinxrange(10):printf.readline()顺便说一句,当我用/dev/urandom尝试这个时,它成功了。 最佳答案 FWIW,以半便携方式访问此流(或类似流)的首选方式是os.urandom() 关于python-如何在python中读取/开发/随机,我们在StackOverflow上

python - 随机森林分类器分割错误

一直在尝试在包含20个左右标签的约50,000个条目的数据集上运行RF分类器,我认为这应该没问题,但在尝试拟合时我不断遇到以下问题......ExceptionMemoryError:MemoryError()in'sklearn.tree._tree.Tree._resize'ignoredSegmentationfault(coredumped)数据集已通过TfidfVectorizer,然后通过n=100的TruncatedSVD进行降维。RandomForestClassifier以n_jobs=1和n_estimators=10运行,试图找到它可以工作的最小点。该系统使用4G

python - 了解 scikit 学习预测的随机森林内存要求

我有一组2000棵经过训练的随机回归树(来自scikitlearn的随机森林回归器,n_estimators=1)。使用multiprocessing和共享内存在大型数据集(~100000*700000=70GB@8位)上并行训练树(50个核心),效果非常好。请注意,我没有使用RF的内置多核支持,因为我事先进行了功能选择。问题:并行测试大型矩阵(~20000*700000)时,我总是内存不足(我可以访问具有500GBRAM的服务器)。我的策略是将测试矩阵保存在内存中并在所有进程之间共享。根据statementbyoneofthedevelopers测试的内存要求是2*n_jobs*si

python - 为什么生成 400,000,000 个随机数的速度会下降?

我在配备8GBRAM的macOS上的4核(8线程超线程)Inteli7上并行生成大约400,000,000(4亿)个随机数。但是,我还在具有64GBRAM的Debian上具有20个内核的D​​igitalOcean服务器上生成了400,000,000个随机数。代码如下:importmultiprocessingimportrandomrangemin=1rangemax=9defrandomGenPar_backend(backinput):returnrandom.randint(rangemin,rangemax)defrandomGenPar(num):pool=multipro

python - 随机 int64 和 float64 数字

我正在尝试使用Numpy为整数和float生成随机64位整数值,在该类型的整个有效值范围内。要生成随机32位float,我可以使用:In[2]:np.random.uniform(low=np.finfo(np.float32).min,high=np.finfo(np.float32).max,size=10)Out[2]:array([1.47351436e+37,9.93620693e+37,2.22893053e+38,-3.33828977e+38,1.08247781e+37,-8.37481260e+37,2.64176554e+38,-2.72207226e+37,2.

python - Python 2.7.3 哈希字符串如何用于为随机数生成器提供种子?

在64位Python2.7.6中这是True,但在32位Python2.7.3中它是False:random.Random(hash("a")).random()==random.Random("a").random()那么Python2.7.3哈希字符串如何用于为随机数生成器提供种子? 最佳答案 这是因为在32位上hash("a")是一个负数(因为平台长类型大小)并且随机模块的行为不同。随机模块seed()函数:传递int或long它将使用PyNumber_Absolute()即abs()传递一个对象(一个字符串)它将使用PyLo

python - 选择随机种子并保存

我想为numpy.random选择一个随机种子并将其保存到一个变量中。我可以使用numpy.random.seed(seed=None)设置种子,但是如何让numpy选择随机种子并告诉你它是什么?Number似乎默认在linux上使用/dev/urandom。 最佳答案 作为RandomState基础的MT19937PRNG的完整状态不能包含在单个(正常大小,例如32位或64位)整数中。它的状态有一个624个32位整数数组。使用整数播种实际上会运行一个更小、更简单的PRNG来生成这624个单词。这只是人类手动将PRNG的状态设置为可