这个问题与上一个问题非常相似Database design for a survey , 然而,这个提问者没有具体说明他们正在处理的数据量、数据类型以及他们需要用它做什么,我认为这很重要。
因此,我的任务是向应用程序添加调查功能。该应用程序必须处理 50 个不同的组织,每个组织将有多达 500 个调查。 每项调查将有多达 150 个问题,并将存储从真/假、日期等一直到文本段落的数据。 每项调查将最多回答 10,000 次。
我看到了三种主要的数据库设计方式来满足这一需求。
问题表:[ survey_id, question ] 等
答案表:[question_id, answer]
每个调查的表格,每个问题都有一个字段
每个客户的数据库...(这是同事抛出的一个外卡,我对此非常怀疑)
虽然我喜欢选项 1 的想法,但也存在一些问题。 我们将存储多达 380 亿行,答案字段必须是文本字段,因此查询内容和按日期排序等操作会非常慢。此应用程序预计会提供实时报告。
考虑到数据量和报告要求,我觉得有必要考虑动态创建表格,数据一旦创建就不会更改,因为如果需要更改,则所有内容都将被废弃并重新开始,所以我不担心必须在调查中进行架构更新。 我看到的主要问题是表的数量 25,000 个表似乎很多,我不确定这是否比查询 380 亿行结构不正确的数据更好..或者即使有硬限制我很可能击中。这里的一个好处是我们可以 100% 确定不会有任何表连接,而且一天内评估的不同表的可能性不会超过 500 个。
这将我们带到选项三,这是一位同事提出的,我不确定 MySql(客户端当前使用的数据库)的内部工作,但我认为将其拆分为多个数据库不会同一台服务器上有很多/任何差异吗?话虽如此,我确实有能力使用我想要的任何数据库。
在这种情况下最好的方法是什么?还有第四种我没有考虑过的选择吗?
最佳答案
因此,假设您最关心的是性能,并且您确实知道什么类型的数据应该是答案,我会选择选项 #1,但会使用额外的专门列。
将所有答案保留在一个表格中的一个通用列中,但添加特定于每种类型的附加列,例如。 a_date, a_bool。仅填写一般列和该答案应包含的数据类型的列。类型的数量非常有限,您将能够为它们中的每一个设置索引并利用它们的类型。它的优点还在于您可以存储有关答案类型的信息,因此您可以轻松地只关注特定的答案类型,例如。可用于报告的日期。
您还可以完全分隔表格中的类型,而不是将所有答案都放在一个通用列中,每个类型都有其他答案,您可以只用一个用于文本,一个用于日期等等。这样一来,您应该能够一步解决开放式(文本)答案并减少数据冗余。
奖励:为了提高性能,我还会研究数据库分区,例如。使用每个客户(假设报告将针对每个客户)。
关于mysql - 测量样式应用程序的数据库结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48137785/
我需要在客户计算机上运行Ruby应用程序。通常需要几天才能完成(复制大备份文件)。问题是如果启用sleep,它会中断应用程序。否则,计算机将持续运行数周,直到我下次访问为止。有什么方法可以防止执行期间休眠并让Windows在执行后休眠吗?欢迎任何疯狂的想法;-) 最佳答案 Here建议使用SetThreadExecutionStateWinAPI函数,使应用程序能够通知系统它正在使用中,从而防止系统在应用程序运行时进入休眠状态或关闭显示。像这样的东西:require'Win32API'ES_AWAYMODE_REQUIRED=0x0
对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack
我想用ruby编写一个小的命令行实用程序并将其作为gem分发。我知道安装后,Guard、Sass和Thor等某些gem可以从命令行自行运行。为了让gem像二进制文件一样可用,我需要在我的gemspec中指定什么。 最佳答案 Gem::Specification.newdo|s|...s.executable='name_of_executable'...endhttp://docs.rubygems.org/read/chapter/20 关于ruby-在Ruby中编写命令行实用程序
我有一大串格式化数据(例如JSON),我想使用Psychinruby同时保留格式转储到YAML。基本上,我希望JSON使用literalstyle出现在YAML中:---json:|{"page":1,"results":["item","another"],"total_pages":0}但是,当我使用YAML.dump时,它不使用文字样式。我得到这样的东西:---json:!"{\n\"page\":1,\n\"results\":[\n\"item\",\"another\"\n],\n\"total_pages\":0\n}\n"我如何告诉Psych以想要的样式转储标量?解
我构建了两个需要相互通信和发送文件的Rails应用程序。例如,一个Rails应用程序会发送请求以查看其他应用程序数据库中的表。然后另一个应用程序将呈现该表的json并将其发回。我还希望一个应用程序将存储在其公共(public)目录中的文本文件发送到另一个应用程序的公共(public)目录。我从来没有做过这样的事情,所以我什至不知道从哪里开始。任何帮助,将不胜感激。谢谢! 最佳答案 无论Rails是什么,几乎所有Web应用程序都有您的要求,大多数现代Web应用程序都需要相互通信。但是有一个小小的理解需要你坚持下去,网站不应直接访问彼此
我尝试运行2.x应用程序。我使用rvm并为此应用程序设置其他版本的ruby:$rvmuseree-1.8.7-head我尝试运行服务器,然后出现很多错误:$script/serverNOTE:Gem.source_indexisdeprecated,useSpecification.Itwillberemovedonorafter2011-11-01.Gem.source_indexcalledfrom/Users/serg/rails_projects_terminal/work_proj/spohelp/config/../vendor/rails/railties/lib/r
刚入门rails,开始慢慢理解。有人可以解释或给我一些关于在application_controller中编码的好处或时间和原因的想法吗?有哪些用例。您如何为Rails应用程序使用应用程序Controller?我不想在那里放太多代码,因为据我了解,每个请求都会调用此Controller。这是真的? 最佳答案 ApplicationController实际上是您应用程序中的每个其他Controller都将从中继承的类(尽管这不是强制性的)。我同意不要用太多代码弄乱它并保持干净整洁的态度,尽管在某些情况下ApplicationContr