草庐IT

EM距离

全部标签

python - 加快阵列中所有可能对之间的距离

我有几个(~10^10)个点的x、y、z坐标数组(这里只显示5个)a=[[34.4514.132.17][32.3824.4323.12][33.193.2839.02][36.3427.1731.61][37.8129.1729.94]]我想创建一个新数组,其中仅包含与列表中所有其他点至少有一定距离d的点。我使用while循环写了一段代码,importnumpyasnpfromscipy.spatialimportdistanced=0.1#orsomedistancei=0selected_points=[]whilei=dfordisininterdist):np.array(s

python - GeoDjango 距离查询返回不正确的结果

我刚刚在我的开发机器上启动并运行了GeoDjango。问题是我无法让距离查询正常工作。无论我使用什么SRID,距离结果都完全不同。这是一个例子。>>>fromdjango.contrib.gis.measureimportD>>>fromapp.modelsimportPlace>>>fromdjango.contrib.gis.geosimportPoint>>>qs=Place.objects.all()>>>point=Point(-118,34)>>>qs.filter(coordinates__distance_lte=(point,D(m=1)))[,,,,,,,,,,]问

python - 使用单词列表计算 Levenshtein 距离

首先我想说我是python新手。我试图计算许多单词列表的Levenshtein距离。到目前为止,我成功地为一对单词编写了代码,但是我在为列表编写代码时遇到了一些问题。我只是有两个列表,一个在另一个下面,如下所示:卡洛斯坚持彼得我想将Levenshtein距离用于相似性方法。有人能告诉我如何加载列表,然后使用函数计算距离吗?我会很感激!这是我的两个字符串的代码:#!/usr/bin/envpython#-*-coding=utf-8-*-deflev_dist(source,target):ifsource==target:return0#words=open(test_file.txt

python - 支持大圆距离和多边形的快速 python GIS 库

我正在寻找python的地理图书馆。我需要能够执行以下操作:使用Great-circledistance获取两点之间的距离(以米为单位)(不是线性距离计算)检查点是否在多边形内每秒执行1和2几千次一开始我看过这篇文章:Pythonmoduleforstoringandqueryinggeographicalcoordinates并开始使用geopy.我遇到了2个问题:Geopy不支持多边形geoPy的CPU使用率很高(计算一个点与相对5000个点之间的距离大约需要140毫秒的CPU)我继续寻找并找到了BestPythonGISlibrary?和https://gis.stackexch

python - 计算唯一 Python 数组区域之间的距离?

我有一个带有一组唯一ID补丁/区域的栅格,我已将其转换为二维Pythonnumpy数组。我想计算所有区域之间的成对欧几里得距离,以获得分隔每个栅格block最近边缘的最小距离。由于阵列最初是一个栅格,因此解决方案需要考虑单元格之间的对角线距离(我总是可以通过乘以栅格分辨率将单元格中测量的任何距离转换回米)。我按照thisanswertoarelatedquestion中的建议尝试了scipy.spatial.distance中的cdist函数,但到目前为止,我无法使用可用文档解决我的问题。作为最终结果,我理想地拥有一个3xX数组,其形式为“从ID、到ID、距离”,包括所有可能的区域组合

python - Tensorflow 中的平均欧氏距离

我有两个大小为[batch_size,seq_length,2]的序列张量。我想计算张量之间的平均欧氏距离。执行此操作的优雅方法是什么? 最佳答案 给定两个张量A和B,每个张量的形状都是[batch_size,seq_length,2],您可以计算欧氏距离(L2范数)使用tf.norm:l2_norm=tf.norm(A-B,ord='euclidean') 关于python-Tensorflow中的平均欧氏距离,我们在StackOverflow上找到一个类似的问题:

python - 找到点和线段(不是线)之间的最短距离

我有一组线段(不是线),(A1,B1),(A2,B2),(A3,B3),其中A,B是线段的终点。每个A和B都有(x,y)坐标。问题:我需要知道pointO和linesegments之间的最短距离,如在代码行中实现的所示figure所示。我真正能看懂的代码不是伪代码就是Python。代码:我试图用这段代码解决问题,不幸的是,它不能正常工作。defdist(A,B,O):A_=complex(*A)B_=complex(*B)O_=complex(*O)OA=O_-A_OB=O_-B_returnmin(OA,OB)#coordinatesaregivenA1,B1=[1,8],[6,4]

python - 欧式距离的高效计算

我有一个MxN数组,其中M是观察的数量,N是每个向量的维数。从这个向量数组中,我需要计算向量之间的mean和minimum欧氏距离。在我看来,这需要我计算MC2距离,这是一个O(nmin(k,n-k))算法。我的M是~10,000,我的N是~1,000,这个计算需要~45秒。是否有更有效的方法来计算mean和min距离?也许是一种概率方法?我不需要它非常精确,只要接近即可。 最佳答案 您没有说明您的矢量来自何处,也没有说明您将如何使用mean和median。以下是对一般情况的一些观察。有限的范围、容错和离散值可能允许更有效的方法。M

python - 排名之间的距离

我有两种对字符串列表进行不同排序的方法,我们可以认为这是列表的“正确”排序(即黄金标准)。换句话说:ranked_list_of_strings_1=method_1(list_of_strings)ranked_list_of_strings_2=method_2(list_of_strings)correctly_ranked_list_of_strings#Somepermutationoflist_of_strings考虑到method_1和method_2是黑盒,我如何确定哪种方法更好?在SciPy或scikit-learn或类似库中是否有任何方法可以衡量这一点?在我的具体案

【HDFS】客户端读某个块时,如何对块的各个副本进行网络距离排序?

本文包含如下内容:①通过图解+源码分析/A1/B1/node1和/A1/B2/node2这两个节点的网络距离怎么算出来的②客户端读文件时,副本的优先级。(怎么排序的,排序规则都有哪些?)③我们集群发现的一个问题。客户端读时,通过调用getBlockLocationsRPC获取文件的各个块。在给客户端返回这些块信息之前,NameNode会对每个块的各个副本(例如默认的3副本)按照一定规则排序。这些规则大概有:①把在decommissioned/stale/slow这些状态节点上的副本移到后面;②计算客户端与每个副本所在节点的网络距离,把距离小的放在前面;③同时也会考虑storagetype、节点