NoSQL_草庐IT

mysql - 非规范化建议

我有一个学区数据库(大约15,000个，并且还在不断增加)以及每个学区的员工可用的退休计划/福利。数据已经很好地归一化了:区记录与0或n个退休计划选项相关联(其中n一个地区记录与0或n个yield相关联(其中n接近1个连接表中的40)地区还与其他一些事物相关联，其中关联的数量是名义上的。现在客户要报告。他们希望以一种非常动态的方式进行报告(想想iTunes智能播放列表，可以在其中为任何地区、计划或福利的任何属性(property)添加/删除规则)。我需要允许他们查询某个地区的任何属性(property)、其退休计划或其福利，并返回一切。为了(暂时)保持简单并避免重复数据，我设置了几个V

mysql - 为什么在构建事件源时应该扇出

我正在研究构建ActivityFeed的后勤工作，类似于Facebook或Twitter的时间线。在StackOverlfow和Quora以及我在google上找到的其他文章中，有大量的答案描述了阅读或写作时的扇形展开。这一切都是有道理的。您将所有事件记录在一个主要事件表/集合中，然后在某个时候，将该数据的副本写入到单独的、适合每个用户的表中。我不完全理解的是为什么需要扇出？也就是说，为什么需要记录个人用户订阅源上的事件？您不能只使用一个事件表/集合有什么原因吗？它将具有适当的索引，并具有执行用户的ID。然后，当有人想查看他们的事件流时，只需查询当前用户正在关注的用户的事件流。我知道这

mysql - 按多个标签过滤帖子以返回具有所有这些标签的帖子，性能良好

StackOverflow允许您按标签搜索帖子，并允许您按标签的交集进行过滤，例如rubyxmysqlx标签。但通常使用标签上的多重连接从MySQL检索此类列表效率很低。什么是实现按多个标签查询过滤的更高效的方法？有没有好的NoSQL方法来解决这个问题？最佳答案在NoSQL或面向文档的场景中，您会将实际标签作为文档的一部分，可能存储为列表。由于您已将此问题标记为“couchdb”，因此我将以此为例。CouchDB中的“发布”文档可能如下所示:{"_id":,"question":"Question?","answers":[..

mysql - 将 MySQL 数据/查询集转换为等效的 Cassandra 表示

考虑具有以下表结构的5亿行MySQL表...CREATETABLEfoo_objects(idintNOTNULLAUTO_INCREMENT,foo_stringvarchar(32),metadata_stringvarchar(128),lookup_idint,PRIMARYKEY(id),UNIQUEKEY(foo_string),KEY(lookup_id),);...仅使用以下两个查询来查询...#lookupbyuniquestringkey,maximumofonerowreturnedSELECT*FROMfoo_objectsWHEREfoo_string=?;#

php - 我可以只使用 NOSQL 编写整个应用程序吗？

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visitthehelpcenter.关闭10年前。我正在计划一个旨在存储大量用户数据的应用程序。而且我比较在意数据重试的速度。我听说过一些关于NOSQL的信息，并且知道它提供了比关系数据库更好的性能。所以我打算使用NOSQL(最好是MongoDB)作为我的主要数据库系统。我想问一下是否真的有可能仅使用NOSQL甚至将其用作我的主数据库来创建整个应用程序。我在正确的道路上吗？我还需要使用关系数据库(MySQL)吗？我在NOSQL技术方面完全是新手

mysql - 网络分析的最佳数据存储

我想编写一个自定义的网络分析和行为跟踪解决方案，并将其用作反馈机制，例如。用于搜索或内容建议。如果仅用于短期数据，我会使用一些数据保留有限的NOSQL引擎。但理想情况下，我想保留悠久的历史。我过去看到的一个很好的方法是使用mysql进行存储，每月一张表，将旧表转换为MySQLARCHIVE格式。为了浏览文件和汇总数据，实现了MySQLView。我的问题:GoogleAnalytics之类的东西如何存储其数据？在结构化数据库或其他东西中。您建议采用哪种方式来避免长期内存消耗，同时保持查询可能性的灵active？(我不关心写入数据库的速度，这将发生在异步批处理中而不是实时)

php - 从数据库中检索数据的最有效算法

因此，当我准备迁移到Cassandra时，我将从我的查询中删除连接，Cassandra不支持此功能，而是支持许多select语句。我对我的mysql表(我目前正在使用的)中的50行数据进行了基准测试，结果产生了101个查询(全部选择)并且完成所有这些查询花费了大约0.035秒。然后我将其更改为一些数组操作(目前在PHP中)，并将其减少到3个查询和一堆O(n)for循环。我假设我的系统是在PHP、Python、MySQL还是Cassandra(NoSQL)上，使用几个O(n)for循环而不是更多查询来处理数据要快得多，我已经减少了使用这种新方法的时间从0.035秒到0.004秒，如下所示

mysql - 以最佳方式存储分层数据 : NoSQL or SQL

我正在处理分层数据，就像在树结构中一样。我想知道将它们存储在数据库中的最佳方式是什么。我从MySQL中的邻接表开始。但是随着数据的增加，性能似乎有所下降。我有大约20,000行存储在具有父子关系的MySQL表中，并且将来会增加。获取数据需要很长时间，因为我必须根据树的深度编写许多自连接。所以我一直在寻找存储此类数据的最佳方式。在一个地方，我发现嵌套集比邻接列表更好。然后我被建议看看NoSQL，如果它能解决我的问题的话。所以我现在很困惑是继续使用SQL还是进入无SQL，或者是否有任何其他最佳方法来处理此类数据。那么谁能建议我最好的方法是什么？最佳答案

mysql - 哪个数据库可以在 Raspberry Pi 上存储大指标数据？

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的，因为它们往往会吸引自以为是的答案和垃圾邮件。相反，describetheproblem以及迄今为止为解决该问题所做的工作。关闭8年前。Improvethisquestion我想将RaspberryPi用作一个独立的传感器，它会每秒测量一些值并将此指标数据存储到本地数据库中。然后我想根据日期范围查询数据库。我应该使用哪个数据库，考虑到RPi的资源有限并且会有ca。30758400条记录/年？是否有任何特定于

mysql - 将具有多行的项目从 mysql 映射到 solr

所以我有一个标准化表，其中包含一些我想放入Solr索引中的数据，类似于此+----+--------------+--------------+---------+|id|name|attribute|value|+----+--------------+--------------+---------+|1|Apple|color|green||1|Apple|shape|round||1|Apple|origin|Belgium||2|Motorbike|type|fast||2|Motorbike|nrofwheels|2||3|Officechair|color|grayish