均值滤波

python - Pandas :过去n天的平均值

我有一个像这样的Pandas数据框:test=pd.DataFrame({'Date':['2016-04-01','2016-04-01','2016-04-02','2016-04-02','2016-04-03','2016-04-04','2016-04-05','2016-04-06','2016-04-06'],'User':['Mike','John','Mike','John','Mike','Mike','Mike','Mike','John'],'Value':[1,2,1,3,4.5,1,2,3,6]})正如您在下面看到的，数据集不一定有每天的观察值:DateUs

python - Pandas:如何用 groupby 的平均值填充空值？

我有一个数据集，其中包含一些缺失的数据，如下所示:idcategoryvalue1ANaN2BNaN3A10.54CNaN5A2.06B1.0我需要填充空值才能在模型中使用数据。每次第一次出现类别时，它都是NULL。我想要做的是，对于像类别A和B这样具有多个值的情况，用该类别的平均值替换空值。对于仅出现一次的类别C，只需填写其余数据的平均值。我知道我可以简单地对C这样的情况执行此操作以获取所有行的平均值，但我一直在尝试对A和B执行类别方式并替换空值。df['value']=df['value'].fillna(df['value'].mean())我需要最终的df是这样的idcateg

何用 groupby code pandas value python missing-data imputation

python - Numpy:零均值数据和标准化

我在教程中看到(没有进一步解释)我们可以使用x-=np.mean(x,axis=0)将数据处理为零均值，并使用规范化数据x/=np.std(x,axis=0).谁能详细说明这两段代码，我从文档中得到的唯一信息是np.mean计算算术平均值计算沿特定轴的平均值，而np.std这样做是为了标准偏差。最佳答案这也称为zscore.SciPy有一个实用程序:>>>fromscipyimportstats>>>stats.zscore([0.7972,0.0767,0.4383,0.7866,0.8091,...0.1954,0.6307

python Numpy code section scipy image-preprocessing

python - 在python中创建所需长度的高斯滤波器

谁能建议哪个库支持创建所需长度和sigma的高斯滤波器？我基本上需要以下matlab函数的等效函数:fltr=fspecial('gaussian',[1n],sd) 最佳答案简单的一维高斯不需要库。frommathimportpi,sqrt,expdefgauss(n=11,sigma=1):r=range(-int(n/2),int(n/2)+1)return[1/(sigma*sqrt(2*pi))*exp(-float(x)**2/(2*sigma**2))forxinr]注意:这将始终返回一个以0为中心的奇数长度列表。我

中创建所 section code sigma python scipy

python - Pandas :计算数据框中重复条目的平均值

我一直在使用python和pandas中的数据框，它在第一列中包含重复的条目。数据框看起来像这样:sample_idqualpercent0sample_110201sample_220302sample_150603sample_210904sample_310020我想写一些东西来识别第一列中的重复条目并计算后续列的平均值。理想的输出类似于以下内容:sample_idqualpercent0sample_130401sample_215602sample_310020我整个下午都在为这个问题苦苦挣扎，非常感谢任何帮助。最佳答案

条目 python sample code section pandas

python - python 中的 fft 带通滤波器

我尝试的是用fft过滤我的数据。我有一个以500Hz记录为一维阵列的噪声信号。我的高频应以20Hz截止，低频以10Hz截止。我试过的是:fft=scipy.fft(signal)bp=fft[:]foriinrange(len(bp)):ifnot10我现在得到的是复数。所以一定是出了什么问题。什么？如何更正我的代码？最佳答案值得注意的是，bp的单位大小不一定以Hz为单位，而是取决于信号的采样频率，您应该使用scipy.fftpack.fftfreq为转换。另外，如果你的信号是真实的，你应该使用scipy.fftpack.rff

python fft signal scipy code filtering signal-processing

python - 具有时变截止频率的低通滤波器，使用 Python

如何应用截止频率线性变化(或比线性更一般的曲线)的低通滤波器，例如10000hz到200hz随时间，使用numpy/scipy并且可能没有其他库？例子:在00:00,000，低通截止频率=10000hz在00:05,000，低通截止频率=5000hz在00:09,000，低通截止=1000hz然后截止频率在10秒内保持在1000hz，然后截止频率降低到200hz这里是如何做一个简单的100hz低通:fromscipy.ioimportwavfileimportnumpyasnpfromscipy.signalimportbutter,lfiltersr,x=wavfile.read('

python code import section numpy scipy signal-processing

python - 通过广播减去 numpy 中每一行的平均值

我尝试使用广播减去numpy中矩阵每一行的平均值，但出现错误。知道为什么吗？代码如下:fromnumpyimport*X=random.rand(5,10)Y=X-X.mean(axis=1)错误:ValueError:operandscouldnotbebroadcasttogetherwithshapes(5,10)(5,)谢谢! 最佳答案 mean方法是一个归约操作，这意味着它将一维数字集合转换为单个数字。当您沿轴对n维数组进行缩减时，numpy将该维度折叠为缩减后的值，从而生成(n-1)维数组。在您的例子中，由于X的形状为(

python numpy code section pre

python - 模糊 C 均值算法是否可用于 Python？

我在3维空间中有一些点，我想将它们聚类。我知道Pythons模块“集群”，但它只有K-Means。您知Prop有FCM(模糊C均值)的模块吗？(如果您知道其他一些与聚类相关的python模块，您可以将它们命名为奖励。但重要的问题是python中的FCM算法。)Matlab在Matlab中使用FCM似乎很容易(example)。类似这样的东西不能用于Python吗？NumPy、SciPy和Sage我没有在NumPy中找到FCM,SciPy或Sage.我已经下载了文档并进行了搜索。没有结果Python集群集群模块似乎会在下一个版本中添加模糊C-Means(参见Roadmap)。但我现在需要

python noreferrer noopener nofollow cluster-analysis fuzzy-c-means

python - 具有最小值、最大值、平均值和标准差的箱线图

我需要创建一个箱形图，其中包含一些运行的结果-对于这些运行中的每一个，我都有最小输出、最大输出、平均输出和标准差。这意味着我需要16个带标签的箱线图。examples到目前为止，我遇到了一个数字分布图，但就我而言，这是不可行的。有没有办法在Python(Matplotlib)/R中做到这一点？最佳答案上面@Roland给出的答案很重要:箱形图显示的数量根本不同，如果您使用现有的数量绘制类似的图，可能会使用户感到困惑。我可能会使用堆叠误差条图来表示此信息。例如:importmatplotlib.pyplotaspltimportn

python 具有 section means noreferrer r matplotlib

76 77 787980 81 82