草庐IT

python - 按字母/字典顺序计算两个字符串的平均值

假设您使用字符串'a'和'z'并按字母顺序列出它们之间的所有字符串:['a','b','c'...'x','y','z']。取此列表的中点,您会找到“m”。所以这有点像取这两个字符串的平均值。您可以将其扩展到包含多个字符的字符串,例如,可以在列表['aa','ab','ac'...'zx','zy','zz'].某处是否有Python方法可以执行此操作?如果不知道,即使知道算法的名称也会有所帮助。我开始制作我自己的例程,它简单地遍历两个字符串并找到第一个不同字母的中点,这在'aa'和'az'中点是'am'的情况下似乎很有效,但后来它在它认为是“c”的“cat”、“doggie”中点上失

python - 我使用什么 scipy 统计测试来比较样本均值?

假设样本量不相等,在以下情况下我用什么检验来比较样本均值(如果以下任何一项不正确,请更正):正态分布=True和方差同质性=Truescipy.stats.ttest_ind(sample_1,sample_2)正态分布=True和方差同质性=Falsescipy.stats.ttest_ind(sample_1,sample_2,equal_var=False)正态分布=假和方差同质性=真scipy.stats.mannwhitneyu(sample_1,sample_2)正态分布=假和方差同质性=假??? 最佳答案 快速回答:正

python - 从 netcdf 文件中获取每个月的小时平均值

我有一个netCDF文件,其时间维度包含2年按小时计算的数据。我想对它进行平均以获得每个月一天中每个小时的每小时平均值。我试过这个:importxarrayasxrds=xr.open_mfdataset('ecmwf_usa_2015.nc')ds.groupby(['time.month','time.hour']).mean('time')但是我得到这个错误:***TypeError:`group`mustbeanxarray.DataArrayorthenameofanxarrayvariableordimension我该如何解决这个问题?如果我这样做:ds.groupby('

python - 计算 Pandas 数据框中选定列的选定行的平均值

我有pandasdf,比如100行,10列(实际数据很大)。我还有row_index列表,其中包含哪些行被认为是平均的。我想计算第2、5、6、7和8列的平均值。我们可以使用数据框对象的一些函数来实现吗?我所知道的是做一个for循环,为row_index中的每个元素获取行的值,然后继续做mean。我们是否有一些可以传递row_list、column_list和轴的直接函数,例如df.meanAdvance(row_list,column_list,axis=0)?我看过DataFrame.mean()但我猜它没有帮助。abcdq012305112345211161310000我想要每个a

python - Pandas :过去n天的平均值

我有一个像这样的Pandas数据框:test=pd.DataFrame({'Date':['2016-04-01','2016-04-01','2016-04-02','2016-04-02','2016-04-03','2016-04-04','2016-04-05','2016-04-06','2016-04-06'],'User':['Mike','John','Mike','John','Mike','Mike','Mike','Mike','John'],'Value':[1,2,1,3,4.5,1,2,3,6]})正如您在下面看到的,数据集不一定有每天的观察值:DateUs

python - Pandas:如何用 groupby 的平均值填充空值?

我有一个数据集,其中包含一些缺失的数据,如下所示:idcategoryvalue1ANaN2BNaN3A10.54CNaN5A2.06B1.0我需要填充空值才能在模型中使用数据。每次第一次出现类别时,它都是NULL。我想要做的是,对于像类别A和B这样具有多个值的情况,用该类别的平均值替换空值。对于仅出现一次的类别C,只需填写其余数据的平均值。我知道我可以简单地对C这样的情况执行此操作以获取所有行的平均值,但我一直在尝试对A和B执行类别方式并替换空值。df['value']=df['value'].fillna(df['value'].mean())我需要最终的df是这样的idcateg

python - Numpy:零均值数据和标准化

我在教程中看到(没有进一步解释)我们可以使用x-=np.mean(x,axis=0)将数据处理为零均值,并使用规范化数据x/=np.std(x,axis=0).谁能详细说明这两段代码,我从文档中得到的唯一信息是np.mean计算算术平均值计算沿特定轴的平均值,而np.std这样做是为了标准偏差。 最佳答案 这也称为zscore.SciPy有一个实用程序:>>>fromscipyimportstats>>>stats.zscore([0.7972,0.0767,0.4383,0.7866,0.8091,...0.1954,0.6307

python - Pandas :计算数据框中重复条目的平均值

我一直在使用python和pandas中的数据框,它在第一列中包含重复的条目。数据框看起来像这样:sample_idqualpercent0sample_110201sample_220302sample_150603sample_210904sample_310020我想写一些东西来识别第一列中的重复条目并计算后续列的平均值。理想的输出类似于以下内容:sample_idqualpercent0sample_130401sample_215602sample_310020我整个下午都在为这个问题苦苦挣扎,非常感谢任何帮助。 最佳答案

python - 通过广播减去 numpy 中每一行的平均值

我尝试使用广播减去numpy中矩阵每一行的平均值,但出现错误。知道为什么吗?代码如下:fromnumpyimport*X=random.rand(5,10)Y=X-X.mean(axis=1)错误:ValueError:operandscouldnotbebroadcasttogetherwithshapes(5,10)(5,)谢谢! 最佳答案 mean方法是一个归约操作,这意味着它将一维数字集合转换为单个数字。当您沿轴对n维数组进行缩减时,numpy将该维度折叠为缩减后的值,从而生成(n-1)维数组。在您的例子中,由于X的形状为(

python - 模糊 C 均值算法是否可用于 Python?

我在3维空间中有一些点,我想将它们聚类。我知道Pythons模块“集群”,但它只有K-Means。您知Prop有FCM(模糊C均值)的模块吗?(如果您知道其他一些与聚类相关的python模块,您可以将它们命名为奖励。但重要的问题是python中的FCM算法。)Matlab在Matlab中使用FCM似乎很容易(example)。类似这样的东西不能用于Python吗?NumPy、SciPy和Sage我没有在NumPy中找到FCM,SciPy或Sage.我已经下载了文档并进行了搜索。没有结果Python集群集群模块似乎会在下一个版本中添加模糊C-Means(参见Roadmap)。但我现在需要