草庐IT

mysql - 使用 JSON 而不是规范化数据,这种方法是否正确?

coder 2023-10-04 原文

有微博帖子,以及与之相关的投票/表情,都在 MySQL innoDB 表中。 有两种类型的页面的要求:

(A) 包含许多微博的列表页面以及他们在单个页面上的投票计数/表情符号计数(比如 25)。

例如

THE GREAT FUNNY POST

Not so funny content in a meant to be funny post. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus euismod consequat pellentesque. .....READ MORE....

(3) likes, (5) bored, (7) smiled

. + 同一页面上有 24 个更多帖子。

(B) 固定链接页面,包含一个带有详细投票+投票计数/表情符号的微博。

THE GREAT FUNNY POST

Not so funny content in a meant to be funny post. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus euismod consequat pellentesque. Quisque viverra adipiscing auctor. Mauris ut diam risus, in fermentum elit. Aliquam urna lectus, egestas sit amet cursus et, auctor ut elit. Nulla tempus suscipit nisi, nec condimentum dui fermentum non. In eget lacus mi, ut placerat nisi.

(You, Derp and 1 more like this), (5) bored, (7) smiled

第一种方法:

表#1:

post_id | post_content | post_title | creation_time 

用于存储投票、点赞、表情符号的表#2:

action_id | post_id | action_type | action_creator | creation_time

显示一页帖子或单个帖子。查询第一个表以获取帖子, second 被查询以获取与帖子相关的所有操作。每当投票等完成时,都会在 post_actions 表中插入。

第二种方法:

表#1:

post_id | post_content | post_title | creation_time | action_data 

action_data 可以是 { "likes": 3,"smiles":4 ...}

表#2:

action_id | post_id | action_type | action_creator | creation_time

要显示一页帖子,只查询第一个表以获取帖子和操作数据, 要显示带有详细操作的单个帖子,查询第二个表以获取与帖子相关的所有操作。每当投票等完成时,都会向 post_actions 表和 action_data 进行插入 更新表#1 的字段以存储更新的计数。

假设有 10 万个帖子和 10 次操作,即创建了 100 万个或更多操作。 方法#2 有好处吗?除了必须读取、修改和更新 JSON 信息之外,它还有什么缺点吗? 无论如何,是否可以遵循并进一步改进方法#2?

根据反馈添加更多信息:

  1. Python 脚本将读取、写入数据。
  2. MySQL 数据库服务器将不同于网络服务器。
  3. 由于帖子创建而导致的写入量很低,即每天 10000 个。但由于操作而导致的写入次数可能更高,假设由于投票、点赞、表情符号等操作,每秒最多写入 50 次。
  4. 我关心的是两种方法的读/写性能比较和第二种方法的问题,以及它将来可能存在的不足。

最佳答案

我建议要么将所有喜欢/投票数据(聚合的和原子的)存储在表 1 中并完全丢弃表 2要么使用 2 个没有聚合数据的表,同时依赖于 JOIN 语法、巧妙的查询和良好的索引。

为什么?因为否则在发表评论/投票/点赞时,您将一直查询并写入两个表。假设每个帖子有 10 个 Action 仅用于显示交互,我真的会将其全部存储到一个表中,也许为每种 Action 制作一个额外的列。您可以在数组上使用 JSON 或简单地使用 serialize(),这应该会更快一些。

您最终选择哪种解决方案将在很大程度上取决于您获得的操作数量以及您希望如何使用它们。使用解决方案 1 可以轻松获取 1 个帖子的所有操作,而且速度非常快,但在内部搜索会很麻烦。另一方面,解决方案 2 占用更多空间,需要仔细编写查询和索引。

关于mysql - 使用 JSON 而不是规范化数据,这种方法是否正确?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12970831/

有关mysql - 使用 JSON 而不是规范化数据,这种方法是否正确?的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  3. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

    我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

  4. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  5. ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2

    很好奇,就使用ruby​​onrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提

  6. ruby - 在 Ruby 中使用匿名模块 - 2

    假设我做了一个模块如下:m=Module.newdoclassCendend三个问题:除了对m的引用之外,还有什么方法可以访问C和m中的其他内容?我可以在创建匿名模块后为其命名吗(就像我输入“module...”一样)?如何在使用完匿名模块后将其删除,使其定义的常量不再存在? 最佳答案 三个答案:是的,使用ObjectSpace.此代码使c引用你的类(class)C不引用m:c=nilObjectSpace.each_object{|obj|c=objif(Class===objandobj.name=~/::C$/)}当然这取决于

  7. ruby - 使用 ruby​​ 和 savon 的 SOAP 服务 - 2

    我正在尝试使用ruby​​和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我

  8. ruby - Facter::Util::Uptime:Module 的未定义方法 get_uptime (NoMethodError) - 2

    我正在尝试设置一个puppet节点,但ruby​​gems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter,它工作正常,但如果我通过由ruby​​gems(/usr/bin/facter)安装的二进制文件,它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby

  9. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  10. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

随机推荐