mysql - redis 作为 mysql 的回写 View 计数缓存

coder 2023-07-17 原文

我有一个吞吐量非常高的站点，我试图在 mySQL 数据库中为每个页面存储“查看计数”(出于遗留原因，它们最终必须在 mySQL 中结束)。

绝对数量的 View 使得执行 SQL“UPDATE ITEM SET VIEW_COUNT=VIEW_COUNT+1”类型的语句变得不切实际。有数以百万计的项目，但大多数只被查看了很少的次数，其他的被查看了很多次。

因此，我正在考虑使用 Redis 来收集 View 计数，并使用一个将计数写入 mySQL 的后台线程。这样做的推荐方法是什么？该方法存在一些问题:

后台线程多久运行一次？

它如何确定写回 mySQL 的内容？

我应该为每个命中的 ITEM 存储一个 Redis KEY 吗？

我应该使用什么 TTL？

是否已经有一些预先构建的解决方案或 PowerPoint 演示文稿可以让我走到一半，等等。

我在 StackOverflow 上看到了非常相似的问题，但没有一个有很好的答案......然而!希望此时有更多 Redis 知识。

最佳答案

我认为你需要退后一步，从不同的角度看待你的一些问题才能得到你的答案。

“后台线程多久运行一次？”
要回答这个问题，您需要回答以下问题:您会丢失多少数据？数据在 MySQL 中的原因是什么，以及该数据的访问频率是多少？例如，如果每天只需要为报告查询一次数据库，您可能只需要每天更新一次。另一方面，如果 Redis 实例死了怎么办？你可以失去多少增量并且仍然“好”？这些将提供更新 MySQL 实例的频率问题的答案，我们无法为您解答。

我会使用一种非常不同的策略将其存储在 redis 中。为了讨论起见，让我们假设您决定需要每小时“刷新到数据库”。

将每个命中存储在具有以下行的键名称结构的哈希中:

interval_counter:DD:HH
interval_counter:total

使用页面 ID(例如 URI 的 MD5 总和、URI 本身或您当前使用的任何 ID)作为哈希键，并在页面 View 上进行两次增量；每个哈希一个。这为您提供了每个页面的当前总数和要更新的页面子集。

然后，您将让您的 cron 作业在一小时开始后运行一分钟左右，通过抓取前一小时的哈希来下拉所有具有更新 View 计数的页面。这为您提供了一种非常快速的方法来获取数据以更新 MySQL 数据库，同时避免任何需要进行数学运算或玩弄时间戳等的技巧。通过从不再增加的键中提取数据，您可以避免竞争条件时钟偏差。

您可以为每日 key 设置过期时间，但我宁愿使用 cron 作业在成功更新数据库后将其删除。这意味着如果 cron 作业失败或无法执行，您的数据仍然存在。它还通过不变的键为前端提供一整套已知的命中计数器数据。如果您愿意，您甚至可以保留每日数据，以便能够查看页面受欢迎程度的窗口 View 。例如，如果您通过 cron 作业设置过期而不是删除将每日哈希保持在 7 天左右，您可以显示每个页面在上周每天有多少流量。

执行两个 hincr 操作可以单独或流水线完成，仍然表现得相当好，并且比在代码中进行计算和处理数据更有效。

现在关于过期低流量页面与内存使用的问题。首先，您的数据集听起来不像需要大量内存的数据集。当然，这很大程度上取决于您如何识别每个页面。如果您有一个数字 ID，则内存需求将相当小。如果您仍然有太多内存，您可以通过配置对其进行调整，如果需要，甚至可以使用 32 位 redis 编译来显着减少内存使用。比如我在this answer中描述的数据我曾经管理过互联网上最繁忙的十个论坛之一，它消耗的数据不到 3GB。我还将计数器存储在比我在这里描述的要多得多的“时间窗口”键中。

也就是说，在这个用例中，Redis 是缓存。如果您在上述选项后仍然使用太多内存，您可以设置键的过期时间并为每个 ht 添加一个 expire 命令。更具体地说，如果您遵循上述模式，您将在每次点击时执行以下操作:

hincr -> total
hincr -> daily
expire -> total

这让您可以通过在每次访问时延长其过期时间来保持任何活跃使用的新鲜事物。当然，要做到这一点，您需要包装显示调用，以捕获总计哈希上 hget 的空答案，并从 MySQL 数据库中填充它，然后递增。您甚至可以将两者都作为增量进行。如果您的 Redis 节点需要重新填充，这将保留上述结构，并且可能与从 MySQL 数据库更新 Redis 服务器所需的代码库相同。为此，您需要考虑并决定哪个数据源将被视为权威。

您可以根据您从前面的问题中确定的数据完整性参数，通过修改间隔来调整 cron 作业的性能。要获得更快运行的 cron nob，您可以减小窗口。使用这种方法减少窗口意味着您应该有一个较小的页面集合来更新。这里的一大优势是您无需弄清楚需要更新哪些 key ，然后再去获取它们。您可以执行 hgetall 并迭代哈希的键以进行更新。通过一次检索所有数据，这还可以节省许多往返次数。在任何一种情况下，如果您可能想要考虑从属于第一个的第二个 Redis 实例来进行读取。您仍然会针对 master 进行删除，但这些操作要快得多，并且不太可能在您的大量写入的实例中引入延迟。

如果您需要 Redis DB 的磁盘持久性，那么当然可以将其放在从属实例上。否则，如果您确实经常更改大量数据，那么您的 RDB 转储将不断运行。

我希望这有帮助。没有“预设”答案，因为要正确使用 Redis，您首先需要考虑如何访问数据，这在用户与用户和项目之间有很大不同。在这里，我基于这种描述采取的路线:两个消费者访问数据，一个只显示，另一个确定更新另一个数据源。

关于mysql - redis 作为 mysql 的回写 View 计数缓存，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16761898/

mysql redis br 的 caching

有关mysql - redis 作为 mysql 的回写 View 计数缓存的更多相关文章

ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby-on-rails - 渲染另一个 Controller 的 View - 2
我想要做的是有2个不同的Controller，client和test_client。客户端Controller已经构建，我想创建一个test_clientController，我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集，然后呈现客户端Controller的索引View，以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>
ruby - RSpec - 使用测试替身作为 block 参数 - 2
我有一些Ruby代码，如下所示:Something.createdo|x|x.foo=barend我想编写一个测试，它使用double代替block参数x，这样我就可以调用:x_double.should_receive(:foo).with("whatever").这可能吗？最佳答案 specify'something'dox=doublex.should_receive(:foo=).with("whatever")Something.should_receive(:create).and_yield(x)#callthere
ruby-on-rails - 如何在我的 Rails 应用程序 View 中打印 ruby 变量的内容？ - 2
我是一个Rails初学者，但我想从我的RailsView(html.haml文件)中查看Ruby变量的内容。我试图在ruby中打印出变量(认为它会在终端中出现)，但没有得到任何结果。有什么建议吗？我知道Rails调试器，但更喜欢使用inspect来打印我的变量。最佳答案您可以在View中使用puts方法将信息输出到服务器控制台。您应该能够在View中的任何位置使用Haml执行以下操作:-puts@my_variable.inspect 关于ruby-on-rails-如何在我的R
ruby-on-rails - 如何在 Rails View 上显示错误消息？ - 2
我是rails的新手，想在form字段上应用验证。myviewsnew.html.erb.....模拟.rbclassSimulation{:in=>1..25,:message=>'Therowmustbebetween1and25'}end模拟Controller.rbclassSimulationsController我想检查模型类中row字段的整数范围，如果不在范围内则返回错误信息。我可以检查上面代码的范围，但无法返回错误消息提前致谢最佳答案关键是您使用的是模型表单，一种显示ActiveRecord模型实例属性的表单。c
ruby - 如何在 Ubuntu 中清除 Ruby Phusion Passenger 的缓存？ - 2
我试过重新启动apache，缓存的页面仍然出现，所以一定有一个文件夹在某个地方。我没有“公共(public)/缓存”，那么我还应该查看哪些其他地方？是否有一个URL标志也可以触发此效果？最佳答案您需要触摸一个文件才能清除phusion，例如:touch/webapps/mycook/tmp/restart.txt参见docs 关于ruby-如何在Ubuntu中清除RubyPhusionPassenger的缓存？，我们在StackOverflow上找到一个类似的问题：
ruby-on-rails - Ruby on Rails 计数器缓存错误 - 2
尝试在我的RoR应用程序中实现计数器缓存列时出现错误Unknownkey(s):counter_cache。我在这个问题中实现了模型关联:Modelassociationquestion这是我的迁移:classAddVideoVotesCountToVideos0Video.reset_column_informationVideo.find(:all).eachdo|p|p.update_attributes:videos_votes_count,p.video_votes.lengthendenddefself.downremove_column:videos,:video_vot
ruby - 使用多个数组创建计数 - 2
我正在尝试按0-9和a-z的顺序创建数字和字母列表。我有一组值value_array=['0','1','2','3','4','5','6','7','8','9','a','b'，'光盘'，'e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','','u','v','w','x','y','z']和一个组合列表的数组，按顺序，这些数字可以产生x个字符，比方说三个list_array=[]和一个当前字母和数字组合的数组(在将它插入列表数组之前我会把它变成一个字符串，]current_combo['0','0','0']
ruby - 字符串文字中的转义状态作为 `String#tr` 的参数 - 2
对于作为String#tr参数的单引号字符串文字中反斜杠的转义状态，我觉得有些神秘。你能解释一下下面三个例子之间的对比吗？我特别不明白第二个。为了避免复杂化，我在这里使用了'd'，在双引号中转义时不会改变含义("\d"="d")。'\\'.tr('\\','x')#=>"x"'\\'.tr('\\d','x')#=>"\\"'\\'.tr('\\\d','x')#=>"x" 最佳答案在tr中转义tr的第一个参数非常类似于正则表达式中的括号字符分组。您可以在表达式的开头使用^来否定匹配(替换任何不匹配的内容)并使用例如a-f来匹配一
ruby-on-rails - 复数 for fields_for has_many 关联未显示在 View 中 - 2
目前，Itembelongs_toCompany和has_manyItemVariants。我正在尝试使用嵌套的fields_for通过Item表单添加ItemVariant字段，但是使用:item_variants不显示该表单。只有当我使用单数时才会显示。我检查了我的关联，它们似乎是正确的，这可能与嵌套在公司下的项目有关，还是我遗漏了其他东西？提前致谢。注意:下面的代码片段中省略了不相关的代码。编辑:不知道这是否相关，但我正在使用CanCan进行身份验证。routes.rbresources:companiesdoresources:itemsenditem.rbclassItemi

mysql - redis 作为 mysql 的回写 View 计数缓存

有关mysql - redis 作为 mysql 的回写 View 计数缓存的更多相关文章

随机推荐