java - App 引擎数据存储区 : How to implement Posts and Tags without joins?

coder 2024-03-04 原文

我正在 Google App Engine (Java) 中构建一个应用程序，用户可以在其中发布帖子，并且我正在考虑为这些帖子添加标签，所以我会有这样的东西:

在实体帖子中:

public List<Key> tags;

在实体标签中:

public List<Key> posts;

例如，查询所有带有特定标签的帖子会很容易，但是我怎样才能得到所有带有标签列表的帖子呢？我可以对每个标签进行查询，然后对结果进行交集，但也许有更好的方法……因为如果有很多帖子，那会很慢。

另一件可能更困难的事情是创建一个帖子，让具有共同标签的帖子按共同标签的数量排序，这样我就可以以某种方式获得与这个帖子“相似”的帖子。

好吧，有了联接，这会容易得多，但我是从 App Engine 开始的，真的想不出替换联接的好方法。

谢谢!

最佳答案

使用这种设计，恐怕您的标记实体可能会成为瓶颈，尤其是当您希望某些标记非常常见时。我能想到的三个具体问题是获取和放置的效率、写入争用和爆炸式索引。让我们以 stackoverflow 为例 - 现在有 14,000 个标记为“java”的帖子。

这意味着每次您需要获取 java 标记实体时，您都在从数据存储中拉回值(value) 14k 的关键数据。那么当你做一个看跌期权时，你就会把它全部发回去。这可能会增加很多字节。
除了来回传输字节之外，每次放置都需要更新索引。 ListProperty 中的每个条目都映射到一个单独的索引条目。所以现在你正在做很多索引更新。这将我们带到了 3 号......
指数爆炸式增长。每个实体对其可以拥有的索引条目数量都有限制。我认为每个实体的限制是 5000。所以这实际上是对有多少帖子可以有相同标签的硬性限制。

进一步阅读:

这post涉及大列表的一些问题
Exploding indexes

好消息是，您的一些要求只需 Post 实体即可轻松处理。例如，您可以使用这样的查询过滤器轻松找到具有所有标签列表的所有帖子:

Query q = pm.newQuery(Post.class)
q.setFilter("tags" == 'Java' && "tags == 'appengine'");

对于所有带有 java 或 appengine 标签的帖子，您需要为每个标签执行一个查询，然后自己组合结果。数据存储目前不处理 OR/IN 类型的操作。

查找相关帖子听起来很棘手。我会在喝咖啡后考虑一下。

关于java - App 引擎数据存储区 : How to implement Posts and Tags without joins?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1079379/

implement without section 的 code java google-app-engine database-design google-cloud-datastore

有关java - App 引擎数据存储区 : How to implement Posts and Tags without joins?的更多相关文章

ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 在没有 sass 引擎的情况下使用 sass 颜色函数 - 2
我想在一个没有Sass引擎的类中使用Sass颜色函数。我已经在项目中使用了sassgem，所以我认为搭载会像以下一样简单:classRectangleincludeSass::Script::FunctionsdefcolorSass::Script::Color.new([0x82,0x39,0x06])enddefrender#hamlengineexecutedwithcontextofself#sothatwithintemlateicouldcall#%stop{offset:'0%',stop:{color:lighten(color)}}endend更新:参见上面的#re
java - 等价于 Java 中的 Ruby Hash - 2
我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么？最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设？关于java-等价于Java中的RubyHash，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/22737685/
ruby-on-rails - 每次我尝试部署时，我都会得到 - (gcloud.preview.app.deploy) 错误响应 : [4] DEADLINE_EXCEEDED - 2
我是Google云的新手，我正在尝试对其进行首次部署。我的第一个部署是RubyonRails项目。我基本上是在关注thisguideinthegoogleclouddocumentation.唯一的区别是我使用的是我自己的项目，而不是他们提供的“helloworld”项目。这是我的app.yaml文件runtime:customvm:trueentrypoint:bundleexecrackup-p8080-Eproductionconfig.ruresources:cpu:0.5memory_gb:1.3disk_size_gb:10当我转到我的项目目录并运行gcloudprevie
ruby - Ruby 有 `Pair` 数据类型吗？ - 2
有时我需要处理键/值数据。我不喜欢使用数组，因为它们在大小上没有限制(很容易不小心添加超过2个项目，而且您最终需要稍后验证大小)。此外，0和1的索引变成了魔数(MagicNumber)，并且在传达含义方面做得很差(“当我说0时，我的意思是head...”)。散列也不合适，因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题，但我很想知道:Ruby标准库是否已经带有这样一个类？最佳
ruby-on-rails - 如何重命名或移动 Rails 的 README_FOR_APP - 2
当我在我的Rails应用程序根目录中运行rakedoc:app时，API文档是使用/doc/README_FOR_APP作为主页生成的。我想向该文件添加.rdoc扩展名，以便它在GitHub上正确呈现。更好的是，我想将它移动到应用程序根目录(/README.rdoc)。有没有办法通过修改包含的rake/rdoctask任务在我的Rakefile中执行此操作？是否有某个地方可以查找可以修改的主页文件的名称？还是我必须编写一个新的Rake任务？额外的问题:Rails应用程序的两个单独文件/README和/doc/README_FOR_APP背后的逻辑是什么？为什么不只有一个？
java - 从 JRuby 调用 Java 类的问题 - 2
我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java，并成功地将它与另一个Java包一起使用，但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www
ruby-on-rails - Rails 中的推荐引擎 - 2
我想为我的Rails网络应用程序提供推荐功能。特别是，我想向新注册的用户推荐他可能想要关注的其他用户。Rails中是否有用于此目的的引擎/gem？如果没有，我应该从哪里开始构建它？谢谢。最佳答案有Coletivogemhttps://github.com/diogenes/coletivo我试了一下。在MySQL上运行。Neo4jhttp://neo4j.org真的很容易实现一个“跟随谁”。事实上，大多数展示其能力的样本都涉及“跟随谁”。快速提示-只有在JRuby上运行时，Neo4j.rb才会很酷。如果不是-使用Neograph
java - 我的模型类或其他类中应该有逻辑吗 - 2
我只想对我一直在思考的这个问题有其他意见，例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我
java - 什么相当于 ruby 的 rack 或 python 的 Java wsgi？ - 2
什么是ruby的rack或python的Java的wsgi？还有一个路由库。最佳答案来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

java - App 引擎数据存储区 : How to implement Posts and Tags without joins?

有关java - App 引擎数据存储区 : How to implement Posts and Tags without joins?的更多相关文章

随机推荐