草庐IT

采样位数

全部标签

python - 如何获取 Pandas 数据框中一行的百分位数?

ExampleDataFrameValues-078138242348431589694710281229122stats.percentileofscore(temp['INCOME'].values,38,kind='mean')15.0stats.percentileofscore(temp['INCOME'].values,38,kind='strict')10.0stats.percentileofscore(temp['INCOME'].values,38,kind='weak')20.0stats.percentileofscore(temp['INCOME'].valu

python - matplotlib 在不重新采样的情况下绘制小图像

我正在尝试使用matplotlib在python中绘制一个小图像,并希望显示的轴与生成它的numpy数组具有相同的形状,即不应重新采样数据。换句话说,数组中的每个条目都应对应于屏幕上的一个像素(或附近的像素)。这看起来微不足道,但即使在互联网上搜索了一段时间之后,我似乎也无法让它工作:importnumpyasnpimportmatplotlib.pyplotaspltimportmatplotlib.cmascmX=np.random.rand(30,40)fig=plt.figure()fig.add_axes(aspect="equal",extent=[0,X.shape[1]

python - 寻找整个 Pandas 数据框的中位数

我试图找到整个数据帧的中值流。第一部分是仅选择数据框中的某些项目。这有两个问题,它包括不在“状态”中的数据框部分。此外,中位数不是单个值,它基于行。我将如何获得数据框中所有数据的总体中位数? 最佳答案 两种选择:1)Pandas选项:df.stack().median()2)一个numpy选项:np.median(df.values) 关于python-寻找整个Pandas数据框的中位数,我们在StackOverflow上找到一个类似的问题: https://

python - 使用 strptime() 的 2 位数年份不能很好地解析生日

考虑以下生日(作为dob):68年6月1日69年6月1日当使用Python的datetime.strptime(dob,'%d-%b-%y')解析时,将产生:datetime.datetime(2068,6,1,0,0)datetime.datetime(1969,6,1,0,0)当然他们应该出生在同一个十年,但现在甚至不在同一个世纪!根据docs这是完全有效的行为:When2-digityearsareaccepted,theyareconvertedaccordingtothePOSIXorX/Openstandard:values69-99aremappedto1969-1999

python pandas 添加前导零以使所有月份均为 2 位数字

如何添加前导零,以便至少有两位数。WeekproductquantityMonth0201301coke1.511201302fanta1.722201304coke3.653201306sprite2.4104201308pepsi2.912即将上面的数据框转换为以下内容:WeekproductquantityMonth0201301coke1.5011201302fanta1.7022201304coke3.6053201306sprite2.4104201308pepsi2.912 最佳答案 使用Series的map()方法和

python - 根据位数拆分 Pandas 数据框列

我有一个pandas数据框,它有两列键和值,值总是由一个8位数字组成,例如>df1keyvalue1010000100201000000030101000004011110000现在我需要获取值列并将其拆分为当前的数字,这样我的结果就是一个新的数据框>df_reskey012345671010000100201000000030101000004011110000我无法更改输入数据格式,我认为最传统的方法是将值转换为字符串并循环遍历每个数字字符并将其放入列表中,但是我正在寻找更优雅和更快的东西,请帮忙.编辑:输入不是字符串,而是整数。 最佳答案

python - 生成 3 位数的数字

我想按顺序生成从000到120的数字。我知道您可以使用循环生成0到120之间的数字。但我希望所有数字都具有3位数字。输出应该是000001002......120代替012......120有没有什么简单的方法可以在python中实现这一点,或者我应该为0-910-99和100-120? 最佳答案 ["{0:03}".format(i)foriinrange(121)]或["%03d"%iforiinrange(121)]打印:print"\n".join()在Python3.6+中更简洁:[f"{i:03}"foriinrange

python - 确定 Python 中特定数字的精度和小数位数

我在Python中有一个包含float的变量(例如num=24654.123),我想确定数字的精度和标度值(在Oracle意义上),所以123.45678应该给我(8,5),12.76应该给我(4,2),等等。我首先考虑使用字符串表示(通过str或repr),但是对于大数字这些都失败了(虽然我现在明白这是float的局限性代表就是这里的问题):>>>num=1234567890.0987654321>>>str(num)=1234567890.1>>>repr(num)=1234567890.0987654编辑:下面的要点。我应该澄清一下。该数字已经是一个float,正在通过cx_Or

python - Pandas 时间序列重新采样结束给定的一天

我怀疑许多处理时间序列数据的人已经遇到过这个问题,而pandas似乎没有提供直接的解决方案(还!):假设:您有一个包含收盘价的每日数据时间序列,按日期(天)编制索引。今天是19JUN。LastClose数据值为18JUN。您想要将每日数据重新采样到OHLC条中,以某个给定的频率(比如M或2M)结束于6月18日。所以对于Mfreq,最后一根柱线是19MAY-18JUN,前一根柱线是19APR-18MAY,依此类推...ts.resample('M',how='ohlc')将进行重采样,但“M”是“end_of_month”期间,因此结果将给出2014-05的完整月份和2014-06的2周

python - 如何将具有日期时间索引的 df 重新采样到恰好 n 个大小相等的周期?

我有一个带有日期时间索引的大型数据框,需要将数据重新采样到恰好10个大小相等的周期。到目前为止,我已经尝试找到第一个和最后一个日期以确定数据中的总天数,将其除以10以确定每个期间的大小,然后使用该天数重新采样。例如:first=df.reset_index().timesubmit.min()last=df.reset_index().timesubmit.max()periodsize=str((last-first).days/10)+'D'df.resample(periodsize,how='sum')这并不能保证重采样后df中恰好有10个周期,因为周期大小是一个向下舍入的整数