django - 为每个用户检索最相关输出的最佳解决方案(在 Django 或任何后端中)？

coder 2023-11-08 原文

我正在寻找最佳解决方案来为每个用户检索最相关的输出。

我将模型简化为 UserProfile 和 Groups，如下所示

-Model Name: UserProfile
styles: ['a', 'b', 'f', 'r'] <- ('styles' are field name)

-Group 1
styles: ['a', 'f']

-Group 2
['g', 'a', 'h']

 ...

-Group 1,000,000
styles: ['s', 'w', 'x']
(Let's say we have millions of Groups)

我想根据用户的样式对组进行排序和检索。所以在这种情况下，“第 1 组”由于样式“a”、“f”、 “第 2 组”由于样式“a”而得 1 分。

我们无法将分数存储在我们的主数据库中，因为每个用户都有不同的风格。

我的方法 1:每次用户请求时对所有数据库进行排名(我概念性地编写了代码)

View .py

for group in Group.objects.all():
    # store the score to the new field of the group
    group.style_count = group.styles.join_count(user.styles)
list_view_output = Group.objects.order_by(style_count)

方法 2:将排名存储在数据库中执行查询并将输出(当然还有等级和用户 ID)存储在 Redis 内存缓存数据库中。并在特定用户想要时检索结果

想到的问题:

查询似乎很昂贵。 O(n) 用于迭代 * O( min( user.style.count(), group.style.count() ) ) 用于加入。我怎样才能做得更好？也许我可以在模型中做点什么？
不幸的是，如果我们有 100 万个组和 1000 个用户，我需要在缓存内存 (Redis) 中存储 10 亿行。而且我绝对买不起(我想我最多可以有 8GB，或者更多)
也许我不需要在缓存中存储每个用户的排名数据，因为有些用户具有相同的风格。您知道这方面的任何 AI 方法吗？

您还可以提供任何建议来更好地构建它吗？

谢谢...!!!!!

最佳答案

底线是，对于数百万规模的问题，保存所有内容并对其进行排序可能不是一个好主意。

使用当前的数据结构， - 时间复杂度:O(n)；几乎不可能减少 - 空间复杂度:我们可以改进很多。例如只需要前 10 个，成本可以是 O(1)。我们只能以排序的方式保存前 10 名。在线性扫描中，我们只将新组的分数与最小的分数进行比较，如果新分数较大，则将其替换

但一个可能的问题是，如果你有太多相同分数的组，那么这可能是一个问题。你需要小心处理它。

如果您以“排序”方式组织样式和组，可能会更快。例如，按字母顺序，第 2 组将是 ['a', 'g', 'h']。我们跟踪第一个或几个字母的索引。例如，以'a'开头的组将是第一批；然后以“b”开头的组，依此类推。在您的情况下，您可以通过以下方式进行搜索: 1.首先以'a'开头的组； 2.然后搜索以'b'开头的组； 3. 然后是'f'； 4. 然后是'r'。所以那些在 [a, b, f, r] 中没有任何样式的组不会被触及。这样，它可以为您节省很多时间。

关于django - 为每个用户检索最相关输出的最佳解决方案(在 Django 或任何后端中)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44312956/

django 39 section styles redis artificial-intelligence ranking relevance

有关django - 为每个用户检索最相关输出的最佳解决方案(在 Django 或任何后端中)？的更多相关文章

ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2
很好奇，就使用rubyonrails自动化单元测试而言，你们正在做什么？您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您？git中的预提交Hook？只是手动调用？我完全理解测试，但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的，并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您？最佳答案不确定您到底想听什么，但是有几个级别的自动代码库控制:在处理某项功能时，您可以使用类似autotest的内容获得关于哪些有效，哪些无效的即时反馈。要确保您的提
ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2
我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby - 在 jRuby 中使用 'fork' 生成进程的替代方案？ - 2
在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',
ruby-on-rails - 使用 rails 4 设计而不更新用户 - 2
我将应用程序升级到Rails4，一切正常。我可以登录并转到我的编辑页面。也更新了观点。使用标准View时，用户会更新。但是当我添加例如字段:name时，它不会在表单中更新。使用devise3.1.1和gem'protected_attributes'我需要在设备或数据库上运行某种更新命令吗？我也搜索过这个地方，找到了许多不同的解决方案，但没有一个会更新我的用户字段。我没有添加任何自定义字段。最佳答案如果您想允许额外的参数，您可以在ApplicationController中使用beforefilter，因为Rails4将参数
ruby-on-rails - link_to 不显示任何 rails - 2
我试图在索引页中创建一个超链接，但它没有显示，也没有给出任何错误。这是我的index.html.erb代码。ListingarticlesTitleTextssss我检查了我的路线，我认为它们也没有问题。PrefixVerbURIPatternController#Actionwelcome_indexGET/welcome/index(.:format)welcome#indexarticlesGET/articles(.:format)articles#indexPOST/articles(.:format)articles#createnew_articleGET/article
ruby-on-rails - RSpec:避免使用允许接收的任何实例 - 2
我正在处理旧代码的一部分。beforedoallow_any_instance_of(SportRateManager).toreceive(:create).and_return(true)endRubocop错误如下:Avoidstubbingusing'allow_any_instance_of'我读到了RuboCop::RSpec:AnyInstance我试着像下面那样改变它。由此beforedoallow_any_instance_of(SportRateManager).toreceive(:create).and_return(true)end对此:let(:sport_
ruby-on-rails - 简单的 Ruby on Rails 问题——如何将评论附加到用户和文章？ - 2
我意识到这可能是一个非常基本的问题，但我现在已经花了几天时间回过头来解决这个问题，但出于某种原因，Google就是没有帮助我。(我认为部分问题在于我是一个初学者，我不知道该问什么......)我也看过O'Reilly的RubyCookbook和RailsAPI，但我仍然停留在这个问题上.我找到了一些关于多态关系的信息，但它似乎不是我需要的(尽管如果我错了请告诉我)。我正在尝试调整MichaelHartl'stutorial创建一个包含用户、文章和评论的博客应用程序(不使用脚手架)。我希望评论既属于用户又属于文章。我的主要问题是:我不知道如何将当前文章的ID放入评论Controller。
ruby - RVM "ERROR: Unable to checkout branch ."单用户 - 2
我在新的Debian6VirtualBoxVM上安装RVM时遇到问题。我已经安装了所有需要的包并使用下载了安装脚本(curl-shttps://rvm.beginrescueend.com/install/rvm)>rvm，但以单个用户身份运行时bashrvm我收到以下错误消息:ERROR:Unabletocheckoutbranch.安装在这里停止，并且(据我所知)没有安装RVM的任何文件。如果我以root身份运行脚本(对于多用户安装)，我会收到另一条消息:Successfullycheckedoutbranch''安装程序继续并指示成功，但未添加.rvm目录，甚至在修改我的.bas
ruby-on-rails - Rails 中同一个类的多个关联的最佳实践？ - 2
我认为我的问题最好用一个例子来描述。假设我有一个名为“Thing”的简单模型，它有一些简单数据类型的属性。像...Thing-foo:string-goo:string-bar:int这并不难。数据库表将包含具有这三个属性的三列，我可以使用@thing.foo或@thing.bar之类的东西访问它们。但我要解决的问题是当“foo”或“goo”不再包含在简单数据类型中时会发生什么？假设foo和goo代表相同类型的对象。也就是说，它们都是“Whazit”的实例，只是数据不同。所以现在事情可能看起来像这样......Thing-bar:int但是现在有一个新的模型叫做“Whazit”，看起来

django - 为每个用户检索最相关输出的最佳解决方案(在 Django 或任何后端中)？

有关django - 为每个用户检索最相关输出的最佳解决方案(在 Django 或任何后端中)？的更多相关文章

随机推荐