nans

python - 如何使用数据矩阵中的 nans 计算相关矩阵

当数据中存在NaN时，我找不到一个函数来计算包含两个以上变量观测值的数组的相关系数矩阵。有些函数对变量对执行此操作(或者只是使用~is.nan()屏蔽数组)。但是通过遍历大量变量来使用这些函数，计算每对变量的相关性可能非常耗时。所以我自己尝试并很快意识到这样做的复杂性是协方差的正确归一化问题。我很想听听您对如何操作的意见。代码如下:defnancorr(X,nanfact=False):X=X-np.nanmean(X,axis=1,keepdims=True)*np.ones((1,X.shape[1]))ifnanfact:mask=np.isnan(X).astype(int)f

python - 在 matplotlib 中为 NaN 值设置颜色

我正在尝试绘制一些数组的颜色，并将一些值转换为np.nan(以便于解释)并在绘制时期望不同的颜色(白色？)，但它会导致绘图和颜色条出现问题。#thisisbeforeconvertedtonanarray=np.random.rand(4,10)plt.pcolor(array)plt.colorbar(orientation='horizontal')#conditionalvalueconvertedtonanarray=np.random.rand(4,10)array[array有什么建议吗？最佳答案解决方案之一是绘制屏

matplotlib python array section image numpy nan colorbar

python - 如何使用Python计算最近三个非nan值的平均值

我有一个数据框df看起来像下面这样。我想计算最后3个非nan列的平均值。如果少于三个非缺失列，则平均数缺失。nameday1day2day3day4day5day6day7A11nan2303Bnannannannannannan3C1101111D1101nan14预期输出应该如下所示nameday1day2day3day4day5day6day7expectedA11nan23032我知道如何计算最后三列的平均值并计算有多少个非缺失观察值。df.iloc[:,5:7].count(axis=1)averageofthelastthreecolumndf.iloc[:,5:7].co

python day nan code pandas numpy

python - Pandas TimeSeries 重采样产生 NaN

我正在对PandasTimeSeries进行重采样。时间序列由二进制值(它是一个分类变量)组成，没有缺失值，但在重新采样后出现NaN。这怎么可能？我不能在这里发布任何示例数据，因为它是敏感信息，但我按如下方式创建和重新采样该系列:series=pd.Series(data,ts)series_rs=series.resample('60T',how='mean') 最佳答案 upsampling转换为固定时间间隔，因此如果没有样本，您将得到NaN。您可以通过fill_method='bfill'或正向填充缺失值-fill_metho

TimeSeries python 01 2015 00 pandas time-series resampling

Python:如何用数据框中的条件替换 NaN？

我有一个数据帧df1对应于网络中nodes的egelist和节点本身的value，如下所示:dfnode_inode_jvalue_ivalue_j034893313289NaN235896930245NaN4034589512109NaN618109NaN如果有值，我想添加一个与value_j对应的列w。如果value_j是NaN我想将w设置为i的相邻节点值的平均值.如果node_i只有相邻节点的NaN值设置为w=1。所以最终的数据框应该像傻瓜一样:dfnode_inode_jvalue_ivalue_jw03489333313289NaN51#averageofadjacentno

何用 Python code value value_j pandas apply

python - pandas.Series() 使用 DataFrame 列创建返回 NaN 数据条目

我正在尝试使用简化后的代码将数据帧转换为系列:dates=['2016-1-{}'.format(i)foriinrange(1,21)]values=[iforiinrange(20)]data={'Date':dates,'Value':values}df=pd.DataFrame(data)df['Date']=pd.to_datetime(df['Date'])ts=pd.Series(df['Value'],index=df['Date'])print(ts)然而，打印输出看起来像这样:Date2016-01-01NaN2016-01-02NaN2016-01-03NaN20

条目 DataFrame 2016 code 01 python python-3.x pandas time-series

python - Sci-Kit 学习 SGD 算法时出错 - "Array contains NaN or infinity"

我收到一条错误消息，指出“数组包含NaN或无穷大”。我已经检查了我的数据，包括训练/测试缺失值，没有遗漏任何东西。我可能对“数组包含NaN或无穷大”的含义有错误的解释。importnumpyasnpfromsklearnimportlinear_modelfromnumpyimportgenfromtxt,savetxtdefmain():#createthetraining&testsets,skippingtheheaderrowwith[1:]dataset=genfromtxt(open('C:\\Users\\Owner\\training.csv','r'),delimit

时出 amp code gt dtype python numpy machine-learning scikit-learn nan

python - scipy.minimize 如何处理 NaN？

我在scipy.minimize中使用SLSQP求解器来解决约束优化问题。求解器经常会尝试违反约束的参数值。当违反这些约束时，目标函数返回一个nan。这似乎会带来问题，因为我的近似Jacobian几乎每次重新计算时都充满了nan。通常情况下，优化以exitmode8:Positivedirectionalderivativeforlinesearch终止。我怀疑近似雅可比行列式中的nan是其根源。那么我的问题是scipy.minimize如何处理nan的？它们是良性的，还是应该将它们转换为一个大的(甚至是无限的)数字？据我所知，此信息未包含在Scipy文档的任何地方。

何处 minimize code section nan python optimization scipy

python - pandas 在 to_latex 时用任意数字替换 NAN

我有一个大型多索引多列数据框df，我没有在这里展示。我像这样生成一片索引:subDf=df.sort_index(level=0).loc[:'e']然后该切片在索引的第二层包含NaN:>>>subDf.iloc[0:1]changerobustnessvaluebaselineNaN-14.5to_csv()生成的csv似乎是正确的:>>>subDf.iloc[0:1].to_csv()Out[15]:'robustness,value,change\nbaseline,,-14.5\n'同样，to_html()的功能与预期的一样。但是，当我尝试获取latex_output时，NaN

to_latex python code 39 section pandas nan

python - Scipy 退出 : Unexpected behavour. NaN

注意到一些nan意外出现在我的数据中。(并扩展并整理他们触及的一切)做了一些仔细的调查并产生了一个最小的工作示例:>>>importnumpy>>>fromscipy.specialimportexpit>>>expit(709)1.0>>>expit(710)nanExpit是逆逻辑。Scipydocumentationhere.这告诉我们:expit(x)=1/(1+exp(-x))所以1+exp(-709)==1.0这样expit(709)=1.0似乎相当合理，四舍五入exp(-709)==0。但是，expit(710)是怎么回事？expit(710)==nan意味着1+exp(

Unexpected behavour code expit section python math numpy scipy

16 17 181920 21 22