我有一个大型、复杂的遗留关系数据库,其中包含我们的用户数据。我想构建一个应用程序,根据各种标准对用户群体进行分割(显示所有体重超过 200 磅且穿着红色衬衫的人)。查询将由预定义的参数化谓词组成(想想 outlook 或 gmail 中的消息规则 UI)。完全即席的查询将很少见。
由于遗留架构的复杂性,针对源数据构建 SQL 查询是不切实际的。
第一个天真的想法可能是将要用于分割的数据反规范化到 RDBMS 中的一个非常宽的表中:
id | hat size | shirt color | weight | .... 123 | 7 | blue | 175 | 456 | 6 | red | 205 |
但这并不太吸引人,因为数据会很稀疏,而且列会经常变化(每周?)。在我的环境中,架构更改在逻辑上很困难。
我可以进一步将该表规范化为一个简单的键/值表,但在这一点上,NoSQL 变得很有趣。
所以这是我的问题:
像 MongoDB 或 CouchDB 这样的面向文档的数据库是否适合这种用例?
我没有大量数据(在假设的非规范化表中,有数百万行、300 列左右)。写入相当少(每天 10,000 次)。查询每天会发生几次,响应时间需要以秒为单位。
过去几天我一直在阅读 NoSQL 的各种方法,面向文档的数据库似乎最适合我。欢迎提出更好的方法。
奖励问题 _文档数据库的好处是否值得将新技术引入我们的数据中心的开销?_
我的意思是,我可能可以用我们现有的关系数据库很好地满足性能要求,但我有兴趣涉足 NoSQL 领域,因为我还有其他应用程序在面向文档的数据库真正支付 -关闭,我想先尝试一个简单的应用程序。
最佳答案
我们最近开始将 NoSQL“混合”到我们的技术堆栈中,但我开始通过 Mongo 使用上限集合进行简单的日志记录,以了解该技术并确保它的健壮性,重要的是,确保以后使用 NoSQL 作为持久性时,应用程序代码才有意义。数据和对象的持久化方式将随着这一举措而改变,这也需要考虑在内。
几乎没有什么是传统方法无法完成的,而且您会确信它也会像您期望的那样工作。这是低风险的。但我也想在未来的其他项目中使用它,所以我试了一下。
对于任何新技术,直到它在您的语言领域得到证实,并且您可以证明自己对它感到满意之前,我建议您采取“婴儿步骤”并逐步完成您所描述规模的项目。
顺便问一下,您是否考虑过使用索引 View 来“规范化”您的数据并从中进行选择?只是一个想法。
希望对您有所帮助!
关于mongodb - 面向文档的数据库是否适合此用例?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4621999/
给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru
我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife
我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案
我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查
我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下
有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳
我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI
这似乎非常适得其反,因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误,一个名为UnixSocket的类显然在Windows机器上不能正常工作,等等)。我只是在浪费时间吗?我应该转向不同的脚本语言吗? 最佳答案 我在Windows上使用Ruby的经验很少,但是当我开始使用Ruby时,我是在Windows上,我的总体印象是它不是Windows原生系统。因此,在主要使用Windows多年之后,开始使用Ruby促使我切换回原来的系统Unix,这次是Linux。Rub