我有一个长度为 2016 的列表,但只有 242 个包含数据,其余设置为无。我的目标是在值之间进行插值,以使用简单形式的 IDW(反距离加权)来填补所有空白。 所以我脚本的任务是:
假设我们有一个只有 14 个项目(5 个有效项目)的较小列表:
myList = [26, None, None, None, 31, None, None, 58, None, 42, None, None, None, 79]
resultList = [None] * len(myList)
for i in range(len(myList):
if not myList[i] is None:
resultList[i] = myList[i]
else:
distance = [i - j for j in range(len(myList)) if not myList[j] is None]
neighbors = min([n for n in dist if n>0]), max([n for n in dist if n<0])
# rest of the interpolation (not important for my question):
neighbors_c = [(1/float(n))**2 for n in neighbors]
c_sum = sum(neighbors_c)
neighbors_c = [n/c_sum for n in neighbors_c]
resultList = myList[i-neighbors[0]]*neighbors_c[0] + myList[i-neighbors[1]]*neighbors_c[1]
我正在对许多数据集执行此操作。我发现这种方法每个数据集大约需要 0.59 秒。令我困扰的是,我的列表已全部排序,但我只需要其中的 2 个值。所以99%的距离都是白算的。这让我尝试了两个:在 i-j 变为负数后停止迭代,因为显然它会遇到最接近的值:
所以不是列表理解:
distance = [i - j for j in range(len(myList)) if not myList[j] is None]
我做了一个适当的 for 循环,我在距离超过零后退出并因此再次变大:
dist = []
for j in range(len(myList)):
if not myList[j] is None:
dist.append(i-j)
if i-j < 0: break
通过这种方法,我能够将每个数据集的时间缩短到 0.38 秒。当遍历 myList 中的所有项目时,第二种方法在开始时很快(项目在第 2、3、4 之后被命中,...循环并立即退出),但最后的项目没有改进,因为迭代总是开始在 j=0。
我想知道您是否能想出任何更快的方法来找到数据集中特定数字的两个邻居,而无需检查所有距离并且只取最大的负数和最小的正数。
另外,我对 python 很陌生,所以如果您在我的脚本中发现其他非 pythonic 表达式,请告诉我。非常感谢你们!
最佳答案
更新:
这是使用 numpy interp 的方法:
import numpy as np
myList = [26, None, None, None, 31, None, None, 58, None, 42, None, None, None, 79]
values = [(i, val) for i, val in enumerate(myList) if val is not None]
xp, fp = zip(*values)
print(xp) # (0, 4, 7, 9, 13)
print(fp) # (26, 31, 58, 42, 79)
result = np.interp(np.arange(len(myList)), xp, fp)
print(result) # [ 26. 27.25 28.5 29.75 31. 40. 49. 58. 50. 42. 51.25 60.5 69.75 79. ]
原帖:
正如其他人已经建议的那样,最好使用一些已经在 numpy 或 pandas 中实现的插值。
但是为了完整起见,这里有一个我想出的快速解决方案:
myList = [26, None, None, None, 31, None, None, 58, None, 42, None, None, None, 79]
resultList = []
# first lets split the list into sublists that group the numbers
# and the Nones into groups
for i, item in enumerate(myList):
if i == 0:
resultList.append([item])
else:
if type(resultList[-1][-1]) == type(item):
resultList[-1].append(item)
else:
resultList.append([item])
print(resultList) # [[26], [None, None, None], [31], [None, None], [58], [None], [42], [None, None, None], [79]]
# now lets interpolate the sublists that contain Nones
for i, item in enumerate(resultList):
if item[0] is not None:
continue
# this is a bit problematic, what do we do if we have a None at the beginning or at the end?
if i == 0 or i + 1 == len(resultList):
continue
prev_item = resultList[i - 1][-1]
next_item = resultList[i + 1][0]
difference = next_item - prev_item
item_length = len(item) + 1
for j, none_item in enumerate(item):
item[j] = prev_item + float(j + 1) / item_length * difference
# flatten the list back
resultList = [item for sublist in resultList for item in sublist]
print(resultList) # [26, 27.25, 28.5, 29.75, 31, 40.0, 49.0, 58, 50.0, 42, 51.25, 60.5, 69.75, 79]
我建议您仅将此用于学习或简单情况,因为它不处理列表以 None
关于python - 在列表中查找邻居的最有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34266910/
我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div
总的来说,我对ruby还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我正在尝试设置一个puppet节点,但rubygems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter,它工作正常,但如果我通过由rubygems(/usr/bin/facter)安装的二进制文件,它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。
我想了解Ruby方法methods()是如何工作的。我尝试使用“ruby方法”在Google上搜索,但这不是我需要的。我也看过ruby-doc.org,但我没有找到这种方法。你能详细解释一下它是如何工作的或者给我一个链接吗?更新我用methods()方法做了实验,得到了这样的结果:'labrat'代码classFirstdeffirst_instance_mymethodenddefself.first_class_mymethodendendclassSecond使用类#returnsavailablemethodslistforclassandancestorsputsSeco
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
设置:狂欢ruby1.9.2高线(1.6.13)描述:我已经相当习惯在其他一些项目中使用highline,但已经有几个月没有使用它了。现在,在Ruby1.9.2上全新安装时,它似乎不允许在同一行回答提示。所以以前我会看到类似的东西:require"highline/import"ask"Whatisyourfavoritecolor?"并得到:Whatisyourfavoritecolor?|现在我看到类似的东西:Whatisyourfavoritecolor?|竖线(|)符号是我的终端光标。知道为什么会发生这种变化吗? 最佳答案
我已经从我的命令行中获得了一切,所以我可以运行rubymyfile并且它可以正常工作。但是当我尝试从sublime中运行它时,我得到了undefinedmethod`require_relative'formain:Object有人知道我的sublime设置中缺少什么吗?我正在使用OSX并安装了rvm。 最佳答案 或者,您可以只使用“require”,它应该可以正常工作。我认为“require_relative”仅适用于ruby1.9+ 关于ruby-主要:Objectwhenrun
是否有类似“RVMuse1”或“RVMuselist[0]”之类的内容而不是键入整个版本号。在任何时候,我们都会看到一个可能包含5个或更多ruby的列表,我们可以轻松地键入一个数字而不是X.X.X。这也有助于rvmgemset。 最佳答案 这在RVM2.0中是可能的=>https://docs.google.com/document/d/1xW9GeEpLOWPcddDg_hOPvK4oeLxJmU3Q5FiCNT7nTAc/edit?usp=sharing-知道链接的任何人都可以发表评论