nan

python - 优雅的 numpy 数组移位和 NaN 填充？

我这里有一个特定的性能问题。我正在处理气象预报时间序列，我将其编译成一个numpy二维数组，这样dim0=预测系列开始的时间dim1=预测范围，例如。0到120小时现在，我希望dim0以小时为间隔，但某些来源仅每N小时产生一次预测。例如，假设N=3并且dim1中的时间步长为M=1小时。然后我得到类似的东西12:0011.212.214.015.011.312.013:00nannannannannannan14:00nannannannannannan15:0014.711.512.213.014.315.1但是当然也有13:00和14:00的信息，因为它可以从12:00的预测运行开始

python - Pandas 在保存为 CSV 时更改 NaN 值的格式

我正在使用df并使用numpy来转换数据——包括将空白(或“”)设置为NaN。但是当我将df写入csv时-输出包含字符串'nan'而不是NULL。我环顾四周，但找不到可行的解决方案。这是基本问题:dfindexxyz01NaN21NaN34CSV输出:indexxyz01nan21nan34我尝试了一些方法将“nan”设置为NULL，但csv输出结果为“空白”而不是NULL:dfDemographics=dfDemographics.replace('nan',np.NaN)dfDemographics.replace(r'\s+(+\.)|#',np.nan,regex=True).

python Pandas code section dfDemographics csv nan

Python Numpy 掩码 NaN 不起作用

我只是尝试使用掩码数组来过滤掉一些nan条目。importnumpyasnp#x=[nan,-0.35,nan]x=np.ma.masked_equal(x,np.nan)printx输出如下:masked_array(data=[nan-0.33557216nan],mask=False,fill_value=nan)在x上调用np.isnan()会返回正确的bool数组，但掩码似乎不起作用。为什么我的mask不能像我预期的那样工作？最佳答案您可以使用np.ma.masked_invalid:importnumpyasnpx=

Python Numpy code masked section

python - 在 numpy 数组中查找连续重复的 nan

在numpy数组中找到最大连续重复nan数的最佳方法是什么？例子:fromnumpyimportnan输入1:[nan,nan,nan,0.16,1,0.16,0.9999,0.0001,0.16,0.101,nan,0.16]输出1:3输入2:[nan,nan,2,1,1,nan,nan,nan,nan,0.101,nan,0.16]输出2:4 最佳答案这是一种方法-defmax_repeatedNaNs(a):#MaskofNaNsmask=np.concatenate(([False],np.isnan(a),[False]

python numpy code nan section arrays

python - 为什么 NaN 被视为 float ？

在pandas中，当我们尝试将包含NaN值的系列转换为带有如下代码片段的整数时df.A=df.A.apply(int)，我经常看到错误信息ValueError:cannotconvertfloatNaNtointeger我了解NaN值无法转换为整数。但我对这种情况下抛出的ValueError很好奇。它说floatNaN无法转换为整数。NaN值被视为浮点对象有什么具体原因吗？还是显示的错误消息存在某些问题？最佳答案简短的回答是IEEE754将NaN指定为float值。至于如何将pd.Series转换为特定的数字数据类型，我更喜欢使

视为 python code float section pandas numpy

python - 为什么 collections.Counter 将 numpy.nan 视为平等的？

我对以下行为感到惊讶:>>>importnumpyasnp>>>fromcollectionsimportCounter>>>my_list=[1,2,2,np.nan,np.nan]>>>Counter(my_list)Counter({nan:2,2:2,1:1})#Countertreatsnp.nanasequaland#tellsmethatIhavetwoofthem>>>np.nan==np.nan#However,np.nan'sarenotequalFalse这是怎么回事？当我使用float('nan')而不是np.nan时，我得到了预期的行为:>>>my_list=

collections 视为 code gt nan python numpy

python - 在非 NaN 的列中查找第一个和/或最后一个值的索引

我正在处理来自钻孔的地下测量，其中每种测量类型涵盖不同的深度范围。在这种情况下，深度被用作索引。我需要为每种测量类型找到第一次和/或最后一次出现的数据(非NaN值)的深度(索引)。获取数据帧第一行或最后一行的深度(索引)很容易:df.index[0]或df.index[-1]。诀窍在于找到任何给定列的第一个或最后一个非NaN出现的索引。df=pd.DataFrame([[500,np.NaN,np.NaN,25],[501,np.NaN,np.NaN,27],[502,np.NaN,33,24],[503,4,32,18],[504,12,45,5],[505,8,38,np.NaN]

python NaN index section pandas numpy dataframe

python - 从忽略 inf 和 nan 的 numpy 数组中获取最小的 N 个值

我需要一个好的、快速的方法来从一个可以有任意多个nan和/或inf值的numpy数组中找到10个最小的实数值。我需要确定这些最小实际值的索引，而不是这些值本身。我从numpy中找到了argmin和nanargmin函数。他们并没有真正完成工作，因为我还想指定超过1个值，例如我想要最小的100个值。此外，当它出现在数组中时，它们都返回-inf值作为最小值。heapq.nsmallest有点工作，但它也返回nan和-inf值作为最小值。它也没有给我我正在寻找的索引。如有任何帮助，我们将不胜感激。最佳答案唯一应该将其丢弃的值是负无限值

python numpy code section inf arrays math

python - 处理零乘以 NaN

我正在尝试估计随机变量(RV)的熵，其中涉及步长的计算:p_X*log(p_X)。例如，importnumpyasnpX=np.random.rand(100)binX=np.histogram(X,10)[0]#createhistogramwith10binsp_X=binX/np.sum(binX)ent_X=-1*np.sum(p_X*np.log(p_X))有时p_X应为零，这在数学上使整个项为零。但是python将p_X*np.log(p_X)设为NaN并将整个求和设为NaN。有什么方法可以管理(无需对NaN进行任何显式检查)使p_X*np.log(p_X)在p_X为零时给

乘以 python code p_X section numpy

python - Tensorflow:如何将 NaN 转换为数字？

我在训练我的图表时尝试计算权重的熵，并将其用于正则化。这当然涉及w*tf.log(w)，并且随着我的权重发生变化，其中一些权重必然会进入导致返回NaN的区域。理想情况下，我会在图表设置中包含一条线:w[tf.is_nan(w)]=但是tensorflow不支持那样分配。我当然可以创建一个操作，但这行不通，因为我需要它在整个图的执行过程中发生。我迫不及待地等待图形执行然后“修复”我的权重，这必须是图形执行的一部分。我无法在文档中找到与np.nan_to_num等效的内容。有人有想法吗？(由于显而易见的原因，添加epsilon不起作用) 最佳答案

为数 Tensorflow code section python nan

47 48 495051 52 53