我目前正在尝试设计一个高性能数据库来跟踪点击,然后显示对这些点击的分析。
我预计每 2 周至少会有 1000 万次点击。
有几个变量(每个变量都需要一个唯一的列)我将允许人们在使用点击跟踪时使用它们 - 但我不想将它们限制为 5 个或所以。这就是我考虑创建表 B 的原因,我可以在其中存储每次点击的这些变量。
然而,每次点击可能有 5-15 个以上的变量,具体取决于他们使用的变量数量。如果我将它们存储在一个单独的表中,该表将乘以 10M/2 周乘以用户可能使用的变量。
为了显示变量的分析,我需要连接表。
同时考虑写入性能和最重要的读取性能,如果我将一个 100M 行的表加入到:
有人建议对其进行非规范化,例如拥有 20 列并在未使用时存储 NULL 值吗?
最佳答案
如果我将一个 100M 行的表连接到...,有什么不同吗
是的。 JOIN 的性能仅取决于根据您的 ON 条件查找匹配行所需的时间。这意味着增加连接表的行大小将增加 JOIN 时间,因为要筛选更多行以进行匹配。通常,可以将 JOIN 视为花费 A*B 时间,其中 A 是第一个表中的行数,B 是第二个表中的行数。这是一个非常广泛的陈述,因为优化器可能会采用许多优化策略来更改此值,但这可以被认为是一般规则。
为了提高 JOIN 的效率,特别是对于读取,您应该查看 indexing .索引允许您标记优化器应该索引的列,或者保持运行跟踪以允许更快地评估值。这会增加任何写入操作,因为数据需要修改包含的数据结构(通常是 B 树),但会减少读取操作的时间,因为数据已在此数据结构中预先排序,以便快速查找。
有人建议对其进行反规范化,例如拥有 20 列并在未使用时存储 NULL 值吗?
这里有很多因素可以决定是或否。主要是,存储空间是否会成为一个问题,以及出现重复数据的可能性有多大。如果答案是存储空间不是问题并且不太可能出现重复项,那么一张大表可能是正确的决定。如果您的存储空间有限,那么存储多余的空值可能并不明智。如果您有很多重复值,那么一个大表可能比 JOIN 效率低。
反规范化时要考虑的另一个因素是,如果另一个表想要访问前两个表中的一个值。如果是,那么在非规范化之后获取这些值的 JOIN 将比将两个表分开效率更低。这个问题确实是您在设计数据库并查看其使用方式时需要自己处理的问题。
关于mysql - 执行 JOIN 时 MySQL 表大小是否重要?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45190069/
我的目标是转换表单输入,例如“100兆字节”或“1GB”,并将其转换为我可以存储在数据库中的文件大小(以千字节为单位)。目前,我有这个:defquota_convert@regex=/([0-9]+)(.*)s/@sizes=%w{kilobytemegabytegigabyte}m=self.quota.match(@regex)if@sizes.include?m[2]eval("self.quota=#{m[1]}.#{m[2]}")endend这有效,但前提是输入是倍数(“gigabytes”,而不是“gigabyte”)并且由于使用了eval看起来疯狂不安全。所以,功能正常,
给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru
我在使用omniauth/openid时遇到了一些麻烦。在尝试进行身份验证时,我在日志中发现了这一点:OpenID::FetchingError:Errorfetchinghttps://www.google.com/accounts/o8/.well-known/host-meta?hd=profiles.google.com%2Fmy_username:undefinedmethod`io'fornil:NilClass重要的是undefinedmethodio'fornil:NilClass来自openid/fetchers.rb,在下面的代码片段中:moduleNetclass
这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife
我遵循了教程http://gettingstartedwithchef.com/,第1章。我的运行list是"run_list":["recipe[apt]","recipe[phpap]"]我的phpapRecipe默认Recipeinclude_recipe"apache2"include_recipe"build-essential"include_recipe"openssl"include_recipe"mysql::client"include_recipe"mysql::server"include_recipe"php"include_recipe"php::modul
我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案
我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查
我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下
我在用Ruby执行简单任务时遇到了一件奇怪的事情。我只想用每个方法迭代字母表,但迭代在执行中先进行:alfawit=("a".."z")puts"That'sanalphabet:\n\n#{alfawit.each{|litera|putslitera}}"这段代码的结果是:(缩写)abc⋮xyzThat'sanalphabet:a..z知道为什么它会这样工作或者我做错了什么吗?提前致谢。 最佳答案 因为您的each调用被插入到在固定字符串之前执行的字符串文字中。此外,each返回一个Enumerable,实际上您甚至打印它。试试