均值滤波

Python-pandas 将 NA 替换为数据框中一组的中位数或均值

假设我们有一个df:ABapple1.0apple2.0appleNAorangeNAorange7.0melon14.0melonNAmelon15.0melon16.0要替换NA，我们可以使用df["B"].fillna(df["B"].median())，但它会用所有数据的中位数填充NA在“B”中有什么办法可以用某个A的中位数来代替NA(如下图):ABapple1.0apple2.0apple**1.5**orange**7.0**orange7.0melon14.0melon**15.0**melon15.0melon16.0谢谢! 最佳答案

为数 Python-pandas section code melon python numpy pandas dataframe

python - 使用 Numpy 查找输入数字集的均值、中值、众数或范围

我正在创建一个程序来查找均值、中值、众数或范围。当我运行它时，它工作正常，直到它到达计算答案的部分。它给了我一个“无法使用灵活类型进行预成型”错误。我搜索了此错误，但找不到我需要修复的内容。这是我第一次使用numpy，所以任何帮助都会很棒。importsysimportnumpyasnpwelcomeString=input("WelcometoMMMRCalculator\nWhatwouldyouliketocalculate(Mean,Median,Mode,Range):")ifwelcomeString.lower()=="mean":meanNumbers=input("W

中值 python input section meanNumbers numpy

python - 不规则间隔点的高斯和滤波器

我有一组点(x,y)作为两个向量x,y例如:frompylabimport*x=sorted(random(30))y=random(30)plot(x,y,'o-')现在我想用高斯平滑此数据，并仅在x轴上的某些(规则间隔的)点对其进行评估。让我们说:x_eval=linspace(0,1,11)我得到的提示是这种方法称为“高斯求和滤波器”，但到目前为止我还没有在numpy/scipy中找到任何实现，尽管乍一看这似乎是一个标准问题。由于x值的间距不等，我无法使用scipy.ndimage.gaussian_filter1d。通常这种平滑是通过furrier空间并与内核相乘完成的，但我真

不规则 python section random code numpy scipy gaussian smoothing

python - 定义一个算法，它获取一个数字和一个列表，并根据数字与列表平均值的距离返回一个标量

假设我们有一个列表，它在每次迭代中附加一个介于15和32之间的整数(我们称该整数为rand)。我想设计一种算法，为每个rand分配大约1(1.25到0.75之间)的奖励。分配奖励的规则是这样的。首先我们计算列表的平均值。那么如果rand大于平均值，我们期望奖励小于1，如果rand小于平均值，则奖励高于1。距离越远在average和rand之间，奖励增加/减少的越多。例如:rand=15,avg=23然后reward=1.25rand=32,avg=23然后reward=0.75rand=23,avg=23thenreward=1等等。我为此算法开发了以下代码:importnumpyas

python 一个 code reward rand algorithm numpy

python - 将新列计算为 Pandas 中其他列的平均值

这个问题在这里已经有了答案:Row-wiseaverageforasubsetofcolumnswithmissingvalues(3个答案)关闭4年前。我有一个这个数据框，我想计算一个新列作为salary_1、salary_2和salary_3的平均值:df=pd.DataFrame({'salary_1':[230,345,222],'salary_2':[235,375,292],'salary_3':[210,385,260]})salary_1salary_2salary_3023023521013453753852222292260我怎样才能以最有效的方式在Pandas中做

python Pandas section salary code dataframe

python - 在 Pandas 数据框中查找每三列的平均值

我是Python和Pandas的新手。我有一个Pandas数据框，每月的列从2000(2000-01)到2016(2016-06)不等。我想找到每三个月的平均值并将其分配给新的季度列(2000q1)。我知道我可以做到以下几点:df['2000q1']=df[['2000-01','2000-02','2000-03']].mean(axis=1)df['2000q2']=df[['2000-04','2000-05','2000-06']].mean(axis=1)...df['2016-02']=df[['2016-04','2016-05','2016-06']].mean(axi

python Pandas 2000 39 code dataframe mean

python - 按字母/字典顺序计算两个字符串的平均值

假设您使用字符串'a'和'z'并按字母顺序列出它们之间的所有字符串:['a','b','c'...'x','y','z']。取此列表的中点，您会找到“m”。所以这有点像取这两个字符串的平均值。您可以将其扩展到包含多个字符的字符串，例如，可以在列表['aa','ab','ac'...'zx','zy','zz'].某处是否有Python方法可以执行此操作？如果不知道，即使知道算法的名称也会有所帮助。我开始制作我自己的例程，它简单地遍历两个字符串并找到第一个不同字母的中点，这在'aa'和'az'中点是'am'的情况下似乎很有效，但后来它在它认为是“c”的“cat”、“doggie”中点上失

python 按 39 average print algorithm

python - 我使用什么 scipy 统计测试来比较样本均值？

假设样本量不相等，在以下情况下我用什么检验来比较样本均值(如果以下任何一项不正确，请更正):正态分布=True和方差同质性=Truescipy.stats.ttest_ind(sample_1,sample_2)正态分布=True和方差同质性=Falsescipy.stats.ttest_ind(sample_1,sample_2,equal_var=False)正态分布=假和方差同质性=真scipy.stats.mannwhitneyu(sample_1,sample_2)正态分布=假和方差同质性=假??? 最佳答案快速回答:正

python scipy strong sample code numpy statistics

python - 从 netcdf 文件中获取每个月的小时平均值

我有一个netCDF文件，其时间维度包含2年按小时计算的数据。我想对它进行平均以获得每个月一天中每个小时的每小时平均值。我试过这个:importxarrayasxrds=xr.open_mfdataset('ecmwf_usa_2015.nc')ds.groupby(['time.month','time.hour']).mean('time')但是我得到这个错误:***TypeError:`group`mustbeanxarray.DataArrayorthenameofanxarrayvariableordimension我该如何解决这个问题？如果我这样做:ds.groupby('

时平 python code strong groupby netcdf xarray

python - 计算 Pandas 数据框中选定列的选定行的平均值

我有pandasdf，比如100行，10列(实际数据很大)。我还有row_index列表，其中包含哪些行被认为是平均的。我想计算第2、5、6、7和8列的平均值。我们可以使用数据框对象的一些函数来实现吗？我所知道的是做一个for循环，为row_index中的每个元素获取行的值，然后继续做mean。我们是否有一些可以传递row_list、column_list和轴的直接函数，例如df.meanAdvance(row_list,column_list,axis=0)？我看过DataFrame.mean()但我猜它没有帮助。abcdq012305112345211161310000我想要每个a

中选 python code pre section pandas

75 76 777879 80 81