估计

python - 估计 zip 大小/创建时间

我需要使用Pythonzipfile模块或unix命令行实用程序按需创建ZIP存档。要压缩的资源通常>1GB，不一定适合压缩。我如何有效地估计它的创建时间/大小？最佳答案从大文件中提取一堆小部分。也许每个64个64kblock。随机选择。连接数据，压缩它，测量时间和压缩率。由于您随机选择了部分文件，因此很可能压缩了数据的代表性子集。现在您所要做的就是根据测试数据的时间来估计整个文件的时间。关于python-估计zip大小/创建时间，我们在StackOverflow上找到一个类似的问

python - 边缘遍历成本高的树中总节点的统计估计

我有一个有向树，我想知道它的大小。我没有关于它的深度或节点分布的信息。有两个主要障碍:1)树非常大(~十亿个节点)2)边遍历是昂贵的。是否可以使用统计方法快速估计其大小(节点数)且误差有限？不幸的是，谷歌搜索只会产生精确计数算法，在这些限制条件下该算法的性能会很差。奖金如果我放宽从树到DAG(有向无环图)的约束，我能否同时获得它的大小和唯一路径的数量？例如。对于这个DAG(每条边都指向下方)有19个节点(大小)和23条路径(4条额外的路径，因为红色边缘为其目标节点提供了1条路径，并为其目标节点的子节点提供了3条路径)我尝试过的事情对于树的案例，我正在考虑以下内容:amounts=[]d

python 边缘的 section strong algorithm tree statistics duplicates

python - 在 Python 中使用 LPC 估计共振峰

我是信号处理的新手(以及numpy、scipy和matlab方面的新手)。我正在尝试通过调整此matlab代码在Python中使用LPC估计元音共振峰:http://www.mathworks.com/help/signal/ug/formant-estimation-with-lpc-coefficients.html到目前为止，这是我的代码:#!/usr/bin/envpythonimportsysimportnumpyimportwaveimportmathfromscipy.signalimportlfilter,hammingfromscikits.talkboximport

python code numpy section matlab scipy signal-processing

python - 估计由一组点(Alpha 形状？？)生成的图像区域

我在exampleASCIIfile中有一组点显示二维图像。我想估计这些点填充的总面积。这个平面内有一些地方没有被任何点填充，因为这些区域已被屏蔽掉。我想估计面积可能实用的方法是应用凹包或alpha形状。我试过thisapproach找到合适的alpha值，从而估计面积。fromshapely.opsimportcascaded_union,polygonizeimportshapely.geometryasgeometryfromscipy.spatialimportDelaunayimportnumpyasnpimportpylabasplfromdescartesimportPo

python Alpha points xycoors coords scipy computer-vision shapely concave-hull

python - 如何在 Python 中快速估计点和双三次样条曲面之间的距离？

如何在Python中快速估计点与双三次样条曲面之间的距离？是否有我可以在SciPy、NumPy或其他一些包中利用的现有解决方案？我已经通过双三次插值定义了曲面:importnumpyasnpimportscipy.interpolate#Defineregulargridsurfacexmin,xmax,ymin,ymax=25,125,-50,50x=np.linspace(xmin,xmax,201)y=np.linspace(ymin,ymax,201)xx,yy=np.meshgrid(x,y)z_ideal=(xx**2+yy**2)/400z_ideal+=z_ideal+

何在 python code measured ideal numpy scipy spline

python - 如何从 Scikit-Learn 中的详细输出估计 GridSearchCV 的进度？

现在我正在运行一个非常激进的网格搜索。我有n=135samples我正在运行23folds使用自定义交叉验证训练/测试列表。我有我的verbose=2.下面是我运行的:param_test={"loss":["deviance"],'learning_rate':[0.01,0.025,0.05,0.075,0.1,0.15,0.2],"min_samples_split":np.linspace(0.1,0.5,12),"min_samples_leaf":np.linspace(0.1,0.5,12),"max_depth":[3,5,8],"max_features":["log

Scikit-Learn GridSearchCV code Parallel 34 python machine-learning parameters grid-search

python - 估计两个词之间的音素相似度

我正在使用卡内基梅隆大学的发音词典检测Python中的押韵，并且想知道:如何估计两个词之间的音素相似度？换句话说，是否有一种算法可以识别出“手”和“计划”比“手”和“薯条”更接近押韵这一事实？一些上下文:起初，如果两个词的主重读音节和所有后续音节相同(c06d如果您想在Python中复制)，我愿意说两个词押韵:defcreate_cmu_sound_dict():final_sound_dict={}withopen('resources/c06d/c06d')ascmu_dict:cmu_dict=cmu_dict.read().split("\n")foriincmu_dict:i

音素 python sound noreferrer final algorithm nlp linguistics phoneme

python - Python 中的约束最小二乘估计

我正在尝试使用Scipy执行约束最小二乘估计，这样所有系数都在(0,1)范围内并且总和为1(此功能在Matlab的LSQLIN函数中实现)。有人知道使用Python/Scipy设置此计算的技巧吗？我相信我应该使用scipy.optimize.fmin_slsqp()，但我不完全确定我应该将哪些参数传递给它。[1]非常感谢您的帮助，尼克[1]fmin_slsqp文档中的一个示例在没有引用文本的情况下对我来说有点难以解析——而且我是Scipy的新手。最佳答案 scipy-optimize-leastsq-with-bound-cons

python code section leastsq optimization scipy least-squares

python - 如何估计pyspark中数据框的实际大小？

如何确定数据帧的大小？现在我估计数据框的实际大小如下:headers_size=keyforkeyindf.first().asDict()rows_size=df.map(lambdarow:len(valueforkey,valueinrow.asDict()).sum()total_size=headers_size+rows_size它太慢了，我正在寻找更好的方法。最佳答案来自TamasSzuromi的精彩帖子http://metricbrew.com/how-to-estimate-rdd-or-dataframe-r

pyspark python section size rdd apache-spark dataframe spark-csv

python - Python 数据框中的滚动回归估计

我有一个这样的数据框:DateYX1X2X3222004-05-129.348158e-090.0000810.0000280.000036232004-05-139.285989e-090.0000730.0000810.000097242004-05-149.732308e-090.0000850.0000730.000096252004-05-172.235977e-080.0000890.0000850.000099262004-05-182.792661e-090.0000340.0000890.000150272004-05-199.745323e-090.0000480.

python section 2004 0.000034 pandas dataframe

29 30 313233 34 35