草庐IT

sample_size

全部标签

python Pandas : conditionally select a uniform sample from a dataframe

假设我有一个这样的数据框category1category2other_colanother_col....a1a2a2a3a3a1b10b10b10b11b11b11我想从我的数据框中获取一个样本,以便category1的次数统一。我假设category1中每种类型的数量相同。我知道这可以通过使用pandas.sample()的pandas来完成。但是,我还想确保我选择的示例也具有同样的category2代表。因此,例如,如果我的样本量为5,我会想要这样的东西:a1a2b10b11b10我不想要这样的东西:a1a1b10b10b10虽然这是n=4的有效随机样本,但它不符合我的要求,因

python - 如何使用 Python 的 SWIG 正确包装 std::vector<std::size_t>? std::size_t 的问题

我正在尝试获取std::vector与SWIG合作。我需要为C++库提供一个Python接口(interface)。std::vector原始类型和对象的s工作正常,但std::size_t有问题.我在github上提供了一个MCVEhere.主要问题基本上问题是std::size_t未被识别并且std::vector被视为std::vector>*.当我尝试指定模板时,我得到以下信息。使用%template(VecSize)std::vector;给出:swig-c++-pythonc_swig_vec_std_size.i:0:Warning(490):Fragment'SWIG_

python - scikit随机森林sample_weights的使用

我一直在尝试弄清楚scikit的随机森林sample_weight的用途,但我无法解释我看到的一些结果。从根本上说,我需要它来平衡分类问题与不平衡类。特别是,如果我使用全1的sample_weights数组,我会得到与wsample_weights=None相同的结果。此外,我正在考虑任何权重相等的数组(即全1、全10或全0.8……)都会提供相同的结果。在这种情况下,也许我对权重的直觉是错误的。代码如下:importnumpyasnpfromsklearnimportensemble,metrics,cross_validation,datasets#createasyntheticd

python - 在 Django Rest Framework 中为每个 View 定义分页 page_size

自版本3.3以来,不再可能在View上定义page_size,因为它已移至分页器类。relateddeprecations我们的API为不同的View定义了不同的page_sizes,添加新的分页器子类只是为了覆盖page_size属性让人感觉模棱两可。我无法在View定义中实例化分页器类并使用实例化的__init__方法here.我可以覆盖它并使它成为一个方法,该方法返回一个使用正确参数实例化的实例,但由于它的名称不是get_pagination_class,这可能不是一个好主意。我的问题是,使用适当的page_size属性集动态创建分页器类的最简洁方法是什么?我看过this问题,我

python - 函数 imshow 断言失败 : size. width>0 && size.height>0

我在树莓派上使用opencv2和python。我是python和opencv的新手。我试图读取jpeg图像并显示图像,它显示以下错误:/home/pi/opencv-2.4.9/modules/highgui/src/window.cpp:269:\error:(-215)size.width>0&&size.height>0infunctionimshow.代码是:importcv2#windowstodisplayimagecv2.namedWindow("Image")#readimageimage=cv2.imread('home/pi/bibek/book/test_set/

python - random.sample() 每次都返回相同的随机序列?

我正在使用python的random.sample(population,k)函数从列表中生成一组随机值,​​以创建该列表的新排列。问题是每次它运行一个循环时,它都会生成完全相同的随机序列。为什么是这样?我什至使用了random.seed(i)这样i变量(每次循环都会改变)每次都会为它设置不同的值。还是一样的顺序。什么给!@下面是我的使用方法:definitialBuild(self):alphabet=self.alphabetforiinrange(self.length):value=random.sample(alphabet,1)alphabet.remove(value[0

python - sklearn 问题 : Found arrays with inconsistent numbers of samples when doing regression

这个问题之前似乎有人问过,但我似乎无法评论以进一步澄清已接受的答案,而且我无法弄清楚所提供的解决方案。我正在尝试学习如何使用sklearn处理我自己的数据。我基本上只是得到了过去100年中两个不同国家GDP的年度百分比变化。我现在只是想学习使用单个变量。我基本上想做的是使用sklearn来预测国家A的GDP百分比变化将给定国家B的GDP的百分比变化。问题是我收到一条错误消息:ValueError:Foundarrayswithinconsistentnumbersofsamples:[1107]这是我的代码:importsklearn.linear_modelaslmimportnum

python - AssertionError : incompatible sizes: argument 'height' must be length 2 or scalar (Matplotlib, Python 2.7,绘制图表)

不幸的是,新的一天给Python带来了新的问题:/我有一个由我用Java编写的其他应用程序生成的文件。这个应用程序生成带有一些数据的文件,它是一种随机的东西,因为我无法说出每个文件会有多少行。示例文件如下所示:3SatJan2100:00:0020127SunMar1100:00:0020125FriJan100:00:0020104SatFeb500:00:0020118SunApr1100:00:0020104WedAug2400:00:0020118SatFeb2000:00:0020103ThuOct1300:00:0020119FriDec1700:00:0020104Tue

python - urllib2.urlopen() : getting the size of the content

只要工作允许,我仍然会围绕python工作......我正在使用使用urllib2.urlopen的脚本查询大量内部webUI。我想知道如何从每个请求中获取页面内容的大小。我似乎无法弄清楚这一点。提前致谢MHibbin 最佳答案 printlen(urlopen(url).read())或>>>result=urllib2.urlopen('http://www.spiegel.de')>>>result.headers['content-length']'181291' 关于pytho

python - 索引错误 : index 1 is out of bounds for axis 0 with size 1/ForwardEuler

我正在对一阶微分方程组的x(t)进行数值求解。该系统是:dy/dt=(C)\*[(-K\*x)+M*A]我已经实现了正向欧拉方法来解决这个问题,如下所示:这是我的代码:importmatplotlibimportnumpyasnpfromnumpyimport*fromnumpyimportlinspacefrommatplotlibimportpyplotaspltC=3K=5M=2A=5#------------------------------------------------------------------------------defeuler(f,x0,t):n=l