草庐IT

java - Elasticsearch 的 Liquibase 或 Flyway 数据库迁移替代方案

coder 2023-05-16 原文

我对 ES 很陌生。我一直在尝试寻找一个数据库迁移工具,但我找不到。我想知道是否有人可以帮助我指出正确的方向。

我会在我的项目中使用 Elasticsearch 作为主数据存储。我想对我在项目中开发新模块时运行的所有映射和配置更改/数据导入/数据升级脚本进行版本控制。

过去我使用过 Flyway 或 Liquibase 等数据库版本控制工具。

是否有任何框架/脚本或方法可以与 ES 一起使用来实现类似的功能?

有没有人有任何使用脚本手动执行此操作并运行迁移脚本至少升级脚本的经验。

提前致谢!

最佳答案

从这个角度/需求来看,ES有很大的局限性:

  • 尽管有动态映射,但 ES 不是无模式的,而是模式密集型的。如果此更改与现有文档冲突,则无法更改映射(实际上,如果任何文档具有新映射影响的非空字段,这将导致异常)
  • ES 中的文档是不可变的:一旦你索引了一个,你就只能在其中检索/删除。围绕这一点的语法糖是部分更新,这使得 ES 端的线程安全删除 + 索引(具有相同的 id)

在您的问题中,这意味着什么?基本上,您不能拥有适用于 ES 的经典迁移工具。以下是可以让您更轻松地使用 ES 的原因:

  • 使用严格映射("dynamic": "strict" and/or index.mapper.dynamic: false,看看mapping docs) .这将保护您的索引/类型免受

  • 不小心被错误的类型动态映射

  • 如果您错过数据映射关系中的某些错误,则会出现显式错误

  • 您可以获取实际的 ES 映射并将其与您的数据模型进行比较。如果你的 PL 有足够高的 ES 库,这应该很容易

  • 您可以利用 index aliases用于迁移


所以,一点经验。对我来说,目前合理的流程是这样的:

  • 在代码中描述为模型的所有数据结构。这个模型实际上也提供了 ORM 抽象。
  • 索引/映射创建调用是简单模型的方法。
  • 每个索引都有别名(即 news)指向实际索引(即 news_index_{revision}_{date_created})。

每次部署代码时,你

  1. 尝试把模型(类型)映射。如果它在没有错误的情况下完成,这意味着你要么
  • 放置相同的映射
  • put 映射是旧映射的纯超集(仅提供新字段,旧字段保持不变)
  • 没有文档在受新映射影响的字段中具有值

所有这些实际上意味着您可以使用现有的映射/数据,只需像往常一样使用数据。

  1. 如果 ES 提供关于新映射的异常,您
  • 使用新映射创建新索引/类型(命名为 name_{revision}_{date}
  • 将您的别名重定向到新索引
  • 启动迁移代码,使 bulk快速重新索引的请求 在此重新索引期间,您可以通过别名安全地正常索引新文档。缺点是在重新索引期间部分历史数据可用。

这是经过生产测试的解决方案。围绕这种方法的注意事项:

  • 如果您的读取请求需要一致的历史数据,则不能这样做
  • 您需要重新索引整个索引。如果每个索引有 1 种类型(可行的解决方案),那么它很好。但有时您需要多类型索引
  • 数据网络往返。有时会很痛

总结一下:

  • 尝试在模型中使用良好的抽象,这总是有帮助的
  • 尝试保持历史数据/字段过时。只需牢记这个想法来构建您的代码,这比听起来更容易
  • 我强烈建议您避免依赖利用 ES 实验工具的迁移工具。这些可以随时更改,就像 river-* 工具所做的那样。

关于java - Elasticsearch 的 Liquibase 或 Flyway 数据库迁移替代方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23977688/

有关java - Elasticsearch 的 Liquibase 或 Flyway 数据库迁移替代方案的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby - 在 jRuby 中使用 'fork' 生成进程的替代方案? - 2

    在MRIRuby中我可以这样做:deftransferinternal_server=self.init_serverpid=forkdointernal_server.runend#Maketheserverprocessrunindependently.Process.detach(pid)internal_client=self.init_client#Dootherstuffwithconnectingtointernal_server...internal_client.post('somedata')ensure#KillserverProcess.kill('KILL',

  3. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  4. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  5. ruby-on-rails - 更好的替代方法 try( :output). try( :data). try( :name)? - 2

    “输出”是一个序列化的OpenStruct。定义标题try(:output).try(:data).try(:title)结束什么会更好?:) 最佳答案 或者只是这样:deftitleoutput.data.titlerescuenilend 关于ruby-on-rails-更好的替代方法try(:output).try(:data).try(:name)?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.c

  6. java - 从 JRuby 调用 Java 类的问题 - 2

    我正在尝试使用boilerpipe来自JRuby。我看过guide从JRuby调用Java,并成功地将它与另一个Java包一起使用,但无法弄清楚为什么同样的东西不能用于boilerpipe。我正在尝试基本上从JRuby中执行与此Java等效的操作:URLurl=newURL("http://www.example.com/some-location/index.html");Stringtext=ArticleExtractor.INSTANCE.getText(url);在JRuby中试过这个:require'java'url=java.net.URL.new("http://www

  7. java - 我的模型类或其他类中应该有逻辑吗 - 2

    我只想对我一直在思考的这个问题有其他意见,例如我有classuser_controller和classuserclassUserattr_accessor:name,:usernameendclassUserController//dosomethingaboutanythingaboutusersend问题是我的User类中是否应该有逻辑user=User.newuser.do_something(user1)oritshouldbeuser_controller=UserController.newuser_controller.do_something(user1,user2)我

  8. java - 什么相当于 ruby​​ 的 rack 或 python 的 Java wsgi? - 2

    什么是ruby​​的rack或python的Java的wsgi?还有一个路由库。 最佳答案 来自Python标准PEP333:Bycontrast,althoughJavahasjustasmanywebapplicationframeworksavailable,Java's"servlet"APImakesitpossibleforapplicationswrittenwithanyJavawebapplicationframeworktoruninanywebserverthatsupportstheservletAPI.ht

  9. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  10. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

随机推荐