草庐IT

对数滚降

全部标签

python - python 2.7 中对数对数刻度的最佳拟合线

这是对数刻度的网络IP频率排名图。完成这部分后,我尝试使用Python2.7在对数对数尺度上绘制最佳拟合线。我必须使用matplotlib的“symlog”轴刻度,否则某些值无法正确显示并且某些值会被隐藏。我正在绘制的数据的X值是URL,Y值是URL的相应频率。我的数据是这样的:'http://www.bing.com/search?q=d2l&src=IE-TopResult&FORM=IETR02&conversationid=1230.00052210688591'`http://library.uc.ca/1184.57782298326e-05``http://www.bin

python - 如何在 matplotlib 上可视化对数刻度的值?

我的值差异很小,例如...0.000001。我想以对数刻度将它们可视化。我想知道如何在matplotlib中做到这一点。非常感谢 最佳答案 http://matplotlib.sourceforge.net/api/pyplot_api.html#matplotlib.pyplot.axis只需添加关键字参数log=True或者,举个例子:frommatplotlibimportpyplotimportmathpyplot.plot([xforxinrange(100)],[math.exp(y)foryinrange(100)])

python - Python 中求和对数的数值函数

给定log(a)和log(b),我想计算log(a+b)(在数值稳定的情况下方式)。我为此写了一个小函数:deflog_add(logA,logB):iflogA==log(0):returnlogBiflogA我写了一个程序,这是迄今为止最耗时的一段代码。显然我可以尝试优化它(例如消除递归调用)。你知道从log(a)计算log(a+b)的标准math或numpy函数吗和log(b)?如果没有,您是否知道为该函数制作单个C++Hook的简单方法?它不是一个复杂的函数(它使用float),正如我所说,它占用了我的大部分运行时间。提前致谢,数值方法忍者! 最佳答

python - 对数据框中的所有值求和

我正在尝试将数据框中的所有值求和为一个数字。例如数据框BBG.XAMS.FUR.S_pnl_pos_costBBG.XAMS.MT.S_pnl_pos_costdate2015-03-23-0.674996-0.6749972015-03-2482.70495111.8687482015-03-25-11.02732784.1602102015-03-26228.426675-131.9015562015-03-27-99.744986214.579858我想要返回值377.71658。我试过df.sum()但它只能按列求和。 最佳答案

python - 四倍精度特征值、特征向量和矩阵对数

我正在尝试以四倍精度对角化矩阵,并取其对数。有没有一种语言可以让我使用内置函数完成此操作?请注意,标签中的语言/包不足,存在以下不足:Matlab:不支持四精度。Python/NumPy/SciPy:dtypefloat128的矩阵产生float64的特征向量。Sage:通过GP/PARI的接口(interface)会产生神秘的错误消息。有没有人执行对角化和矩阵对数以达到四倍精度,如果是,怎么做的? 最佳答案 @Matlab:不支持四精度。MultiprecisionComputingToolboxforMATLAB提供任意精度的线

python - scikit-learn GMM 产生正对数概率

我正在使用pythonscikit-learn包中的高斯混合模型来训练我的数据集,但是,我在编码时发现了这一点--G=mixture.GMM(...)--G.fit(...)--G.score(和特征)得到的对数概率是正实数...这是为什么呢?不是对数概率保证为负吗?我明白了。高斯混合模型返回给我们的是对数概率“密度”而不是概率“质量”,因此正值是完全合理的。如果协方差矩阵接近于奇异,那么GMM将不会表现良好,通常这意味着数据不适合此类生成任务 最佳答案 正对数概率没问题。请记住,GMM计算的概率是概率密度函数(PDF),因此在任何

python - Pandas - 使用 datetimeindex 对数据框进行排序

以下是我的数据框,其中包含来自多个Excel文件的值。我想做一个时间序列分析,所以我将索引设为datetimeindex。但是我的索引不是按照日期排列的。以下是我的数据框:ItemDetailsUnitOp.QtyPriceOp.Amt.Cl.QtyPrice.1Cl.Amt.Month2013-04-015In1Pcs-56.0172.78-9675.58-68.0175.79-11953.962013-04-01AdaptorPcs-17.09.00-152.99-17.09.00-152.992013-04-01AgroTapePcs-2.026.25-52.50-2.026.2

python - 如何使用 Pandas DataFrame 对数据库表的现有行执行更新?

我正在尝试查询MySql数据库表的一个子集,将结果提供给PandasDataFrame,更改一些数据,然后将更新的行写回同一个表。我的表大小约为1MM行,我要更改的行数将相对较小(df.to_sql(tablename,engine,if_exists='replace')不是一个可行的选择。是否有一种直接的方法来更新已更改的行,而无需遍历DataFrame中的每一行?我知道这个项目试图模拟“upsert”工作流程,但它似乎只完成了插入新的非重复行的任务,而不是更新现有行的部分内容:GitHubPandas-to_sql-upsert这是我试图在更大范围内完成的工作的框架:import

python - 基于 Numpy 中的其他数组对数组中的数据求和

我有两个大小相同的2Dnumpy数组(在此示例中在大小和内容方面进行了简化)。一个ID矩阵:1112211225112551225522555和一个值矩阵:14.817.074.340.390.225.275.95.640.033.778.939.311.363.656.711.475.778.488.758.679.632.335.352.513.3我的目标是计数并求和第二个矩阵中的值,这些值按第一个矩阵中的ID分组:1:(8,336.8)2:(9,453.4)5:(8,402.4)我可以在for循环中执行此操作,但是当矩阵的大小为数千而不只是5x5和数千个唯一ID时,处理起来会花费

python - 对数据框的所有列进行排序

我有一个2000行和500列的数据框。我想按升序对每一列进行排序。这些列没有名称,它们只是编号为0-500。随机数据:df=pandas.DataFrame(np.random.randint(0,100,size=(2000,500)),columns=range(500))使用df.sort_values(by=0,axis=0)按预期对第0列进行排序。但是随后使用df.sort_values(by=1,axis=0)对第1列进行排序,但再次打乱第0列。换句话说,我想要index012155526753798但我一次只能对一列进行排序。我已经试过了,但它引发了一个关键错误。df.s