草庐IT

redis - 在分层数据模型中使用 Redis 进行复合索引

coder 2023-07-17 原文

我有一个这样的数据模型:

领域:

  • 计数器编号(例如 00888、00777、00123 等)
  • 计数器代码(例如 XA、XD、ZA、SI 等)
  • 开始日期(例如 2017-12-31 ...)
  • 结束日期(例如 2017-12-31 ...)
  • 其他柜台日期(例如xxxxx)

  • 当前的数据结构组织是这样的(根和多子格式):
    counter_num + counter_code
           ---> start_date + end_date --> xxxxxxxx
           ---> start_date + end_date --> xxxxxxxx
           ---> start_date + end_date --> xxxxxxxx
    

    例子:
    00888 + XA
           ---> Jan 10 + Jan 20 --> xxxxxxxx
           ---> Jan 21 + Jan 31 --> xxxxxxxx
           ---> Feb 01 + Dec 31 --> xxxxxxxx
    
    00888 + ZI
           ---> Jan 09 + Feb 24 --> xxxxxxxx
           ---> Feb 25 + Dec 31 --> xxxxxxxx
    
    00777 + XA
           ---> Jan 09 + Feb 24 --> xxxxxxxx
           ---> Feb 25 + Dec 31 --> xxxxxxxx
    

    今天,检索以两种方式发生:
    //Fetch unique counter data using all the composite keys
    counter_number + counter_code + date (start_date <= date <= end_date)
    
    //Fetch all the counter codes and corresponding data matching the below conditions
    counter_number + date (start_date <= date <= end_date)
    

    在 redis 中对此进行建模的最佳方法是什么,因为我需要缓存一些经常命中的数据。我觉得排序集应该以某种方式做到这一点,但无法对其进行建模。

    更新:

    只是为了消除混淆,这里的询问不是针对 SQL“BETWEEN”之类的查询。 '因为我不知道 start_date 和 end_date 值是什么。认为它们只是列名。

    我不要的是
    SELECT * FROM redis_db  
    WHERE counter_num AND 
    date_value BETWEEN start_date AND end_date
    

    我要的是
    SELECT * FROM redis_db
    WHERE counter_num AND
    start_date <= specifc_date AND end_date >= specific_date
    

    注意:该要求非常接近 Redis 多维索引文档中提出的 2D 索引

    https://redis.io/topics/indexes#multi-dimensional-indexes

    我理解了这个概念,但无法消化给出的实现细节。

    最佳答案

    我不太可能在赏金前及时完成这项工作,但到底是什么……

    这听起来像是 geohashing 的工作。 Geohashing 是您想要索引二维(或更高)数据集时执行的操作。例如,如果您有一个城市数据库,并且希望能够快速响应诸如“查找 X 的 50 公里内的所有城市”之类的查询,则可以使用地理哈希。

    对于这个问题,你可以想到 start_dateend_datexy坐标。通常在 geohashing 中,您正在数据集中搜索空间中特定点附近或某个有界空间区域中的点。在这种情况下,您只有一个坐标的下限和另一个坐标的上限。但我想在实践中整个数据集无论如何都是有界的,所以这不是问题。

    如果在 Redis 中有一个库可以做到这一点,那就太好了。可能有,如果你看得够仔细的话。较新版本的 Redis 具有内置的地理散列功能。查看以 GEO 开头的命令.但它并没有声称非常准确,它是为球体表面而不是平面设计的。

    因此,据我所知,您有 3 个选择:

  • 将您的搜索空间映射到球体的一小部分,最好靠近赤道。使用 Redis GEO 命令。要搜索,请使用 GEOSPHERE在覆盖您尝试搜索的三角形的圆上,考虑到内置的不准确度和映射到球体上的失真,然后过滤结果以获取实际在三角形内的结果。
  • 找一些适用于 Redis 的 3rd-party geohashing 客户端,它适用于平面空间并且比 GEO 更准确。
  • 阅读本答案的其余部分,或其他一些关于 geohashing 的入门读物,然后在 Redis 上自己实现。这是最难(但最具教育意义)的选择。

  • 如果您有一个使用数字排序索引数据的数据库,这样您就可以执行诸如“查找 z 介于 ab 之间的所有行/记录”之类的查询,您可以在最重要的。假设坐标是(非负)整数 xy .然后添加一个整数值列 z , 索引 z .计算z , 写 xy二进制,然后从每个数字中取出替代数字。例子:
    x =     969 = 0 1 1 1 1 0 0 1 0 0 1 
    y =    1130 =  1 0 0 0 1 1 0 1 0 1 0
    z = 1750214 = 0110101011010011000110
    

    请注意,索引允许您查找,例如,所有以 z 定位的记录。之间01011000000000000000000101101111111111111111包括的。换句话说,z 的所有记录以 010110 开头.或者换句话说,您可以找到x 的所有记录。以 001 开头和 y110 开头.这组记录对应于我们试图搜索的二维空间中的一个正方形。

    并非所有方块都可以通过这种方式进行搜索。我们将这些称为可搜索方块。假设客户端发送对所有 (x,y) 的所有记录的请求。位于特定矩形内。 (或圆形,或其他一些合理的几何形状。)然后您需要找到一组覆盖矩形的可搜索正方形。然后,对于您选择的每个方格,查询数据库中该方格内的记录并将结果发送给客户端。 (但您必须过滤结果,因为并非正方形中的所有记录实际上都在原始矩形中。)

    需要取得平衡。如果您选择少量的大型特殊方块,您最终可能会覆盖比您需要的更大的 map 区域;对数据库的查询将返回许多您必须过滤掉的额外结果。或者,如果您使用许多特殊的小方块,您将对数据库进行大量查询,其中许多查询不会返回任何结果。

    我上面说了xy可能是 start_timeend_time .但实际上,数据集的分布不会像地理散列的大多数用途那样对称。因此,如果您使用 x = end_time + start_time,性能可能会更好(或更糟)。和 y = end_time - start_time .

    关于redis - 在分层数据模型中使用 Redis 进行复合索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44164152/

    有关redis - 在分层数据模型中使用 Redis 进行复合索引的更多相关文章

    1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

      我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

    2. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

      我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

    3. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

      类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

    4. ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2

      很好奇,就使用ruby​​onrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提

    5. ruby - 在 Ruby 中使用匿名模块 - 2

      假设我做了一个模块如下:m=Module.newdoclassCendend三个问题:除了对m的引用之外,还有什么方法可以访问C和m中的其他内容?我可以在创建匿名模块后为其命名吗(就像我输入“module...”一样)?如何在使用完匿名模块后将其删除,使其定义的常量不再存在? 最佳答案 三个答案:是的,使用ObjectSpace.此代码使c引用你的类(class)C不引用m:c=nilObjectSpace.each_object{|obj|c=objif(Class===objandobj.name=~/::C$/)}当然这取决于

    6. ruby - 使用 ruby​​ 和 savon 的 SOAP 服务 - 2

      我正在尝试使用ruby​​和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我

    7. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

      关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

    8. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

      我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

    9. ruby-on-rails - 按天对 Mongoid 对象进行分组 - 2

      在控制台中反复尝试之后,我想到了这种方法,可以按发生日期对类似activerecord的(Mongoid)对象进行分组。我不确定这是完成此任务的最佳方法,但它确实有效。有没有人有更好的建议,或者这是一个很好的方法?#eventsisanarrayofactiverecord-likeobjectsthatincludeatimeattributeevents.map{|event|#converteventsarrayintoanarrayofhasheswiththedayofthemonthandtheevent{:number=>event.time.day,:event=>ev

    10. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

      我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

    随机推荐