草庐IT

random_sample

全部标签

python - ValueError : This solver needs samples of at least 2 classes in the data, 但数据只包含一个类 : 1. 0

我有一个包含8670个试验的训练数据集,每个试验的长度为125个样本,而我的测试集包含578个试验。当我从scikit-learn应用SVM算法时,我得到了很好的结果。但是,当我应用逻辑回归时,出现了这个错误:"ValueError:Thissolverneedssamplesofatleast2classesinthedata,butthedatacontainsonlyoneclass:1.0".我的问题是为什么SVM能够给出预测但逻辑回归给出这个错误?有没有可能是数据集中有问题,或者只是逻辑回归无法分类,因为训练样本看起来与它相似? 最佳答案

python - 在值数组上调用 random.normal 会增加噪音吗?

我在某人的代码中看到了这种模式:importnumpyasnp#Createarrayxx=np.linspace(0.0,100.0,num=100)#AddNoisexx=np.random.normal(xx)它似乎给数组的每个值都增加了一些噪音,但我找不到这方面的任何文档。发生了什么?是什么决定了噪声的属性(即缩放)?给定值是否被视为来自正态分布的每个样本的平均值(即loc参数)?我也很想知道为什么文档中似乎没有涵盖这种行为。 最佳答案 我也没有看到它的文档,但是许多采用ndarray的numpy函数将operateonit

python - 这在 random.shuffle 的文档中意味着什么?

http://docs.python.org/2/library/random.html#random.shufflerandom.shuffle(x[,random])Shufflethesequencexinplace.Theoptionalargumentrandomisa0-argumentfunctionreturningarandomfloatin[0.0,1.0);bydefault,thisisthefunctionrandom().Notethatforevenrathersmalllen(x),thetotalnumberofpermutationsofxislar

python random.shuffle的随机性

以下来自python网站,关于random.shuffle(x[,random])Shufflethesequencexinplace.Theoptionalargumentrandomisa0-argumentfunctionreturningarandomfloatin[0.0,1.0);bydefault,thisisthefunctionrandom().Notethatforevenrathersmalllen(x),thetotalnumberofpermutationsofxislargerthantheperiodofmostrandomnumbergenerators

python - 在 C 中模拟 Python `random.random()` 功能

我正在尝试用Python中使用的C创建完全相同的MersenneTwister(MT)。基于Lib/random.py以及阅读thedocs,似乎整个MT都是在_random中实现的,它是在C中实现的:TheunderlyingimplementationinCisbothfastandthreadsafe.通过谷歌搜索“Python_random”,我找到了thispageonGitHub这似乎正是我要找的东西,尽管它似乎不是官方的。我使用了那个源代码并剥离了除MT本身、种子函数和双重创建函数之外的所有内容。我还更改了一些类型,以便整数为32位。首先,这是许可证信息(为了安全起见)/

python - sklearn.linear_model.LogisticRegression 每次都返回不同的系数,尽管设置了 random_state

我正在拟合逻辑回归模型并将随机状态设置为固定值。每次我进行“拟合”时,我都会得到不同的系数,例如:classifier_instance.fit(train_examples_features,train_examples_labels)LogisticRegression(C=1.0,class_weight=None,dual=False,fit_intercept=True,intercept_scaling=1,penalty='l2',random_state=1,tol=0.0001)>>>classifier_instance.raw_coef_array([[0.071

python - np.random.multivariate_normal 的混淆行为

我正在使用numpy从多元正态采样,如下所示。mu=[0,0]cov=np.array([[1,0.5],[0.5,1]]).astype(np.float32)np.random.multivariate_normal(mu,cov)它给了我以下警告。RuntimeWarning:covarianceisnotpositive-semidefinite.矩阵显然是PSD。但是,当我使用np.float64数组时,它工作正常。我需要协方差矩阵为np.float32。我究竟做错了什么? 最佳答案 这是fixed2019年3月。如果您仍

python 3 : random. 种子 () : where to call it?

我需要确保我程序中的所有随机性都是完全可复制的。我应该在哪里调用random.seed()?我认为它应该在我的main.py模块中,但它导入了碰巧使用随机函数的其他模块。我可以仔细浏览我的导入以查看哪个是第一个执行的,但是当我更改代码结构时,我将不得不记住再次重做此分析。有什么简单安全的解决方法吗? 最佳答案 在主模块的“导入部分”执行代码实际上是安全的,所以如果您不确定导入可能会或可能不会使用随机模块的其他模块,也许绕过您的种子,您当然可以使用像importrandomrandom.seed(seed_value)importso

python - 如何使用 numpy.random.rand 设置生成点的最小距离约束?

我正在尝试生成一个有效的代码来生成一些随机位置向量,然后我用它来计算一对相关函数。我想知道是否有直接的方法来限制放置在我的框中的任意两点之间允许的最小距离。我目前的代码如下:defpointRun(number,dr):"""Computethe3Dpaircorrelationfunctionforarandomdistributionof'number'particlesplacedintoa1.0x1.0x1.0box."""##Createarrayofdistancesoverwhichtocalculate.r=np.arange(0.,1.0+dr,dr)##Genera

python Pandas : conditionally select a uniform sample from a dataframe

假设我有一个这样的数据框category1category2other_colanother_col....a1a2a2a3a3a1b10b10b10b11b11b11我想从我的数据框中获取一个样本,以便category1的次数统一。我假设category1中每种类型的数量相同。我知道这可以通过使用pandas.sample()的pandas来完成。但是,我还想确保我选择的示例也具有同样的category2代表。因此,例如,如果我的样本量为5,我会想要这样的东西:a1a2b10b11b10我不想要这样的东西:a1a1b10b10b10虽然这是n=4的有效随机样本,但它不符合我的要求,因