Spring-boot支持ElasticSearch的集成, 并提供了spring-boot-starter-data-elasticsearch自动化配置组件。 这里会介绍如何通过该组件, 集成至项目中使用, 并实现基本的增删改查功能,同时演示集成的一些高级用法, 比如流式查询、自定义查询和异步查询。
创建工程spring-boot-elasticsearch

启动类:
com.mirson.spring.boot.elastic.startup.ElasticSearchApplication
@SpringBootApplication
@ComponentScan(basePackages = {"com.mirson"})
@EnableElasticsearchRepositories(basePackages = {"com.mirson"})
public class ElasticSearchApplication {
public static void main(String[] args) {
SpringApplication.run(ElasticSearchApplication.class, args);
}
}
需要开启EnableElasticsearchRepositories注解, 扫描Repositories接口。
POM依赖
<dependencies>
<!-- Spring Boot Web 依赖组件 -->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<!-- Spring Boot Data ElasticSearch 依赖组件 -->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-data-elasticsearch</artifactId>
</dependency>
</dependencies>
采用spring-boot-starter-data-elasticsearch组件, Spring Boot 提供的elasticsearch自动化配置。
工程配置
application.yml
# 服务端口
server:
port: 22716
# 服务名称
spring:
application:
name: boot-es
data:
elasticsearch:
# 集群名称
cluster-name: my-application
# 节点的地址, 注意采用的API端口, 非服务端口
cluster-nodes: 10.10.20.15:9300
# 是否开启本地存储
repositories:
enabled: true
注意, 这里采用的是ElasticSearch的API端口, 非服务端口。
新建com.mirson.spring.boot.elastic.po.User
@Data
@Document(indexName = "business",type = "user", shards = 1,replicas = 0, refreshInterval = "-1")
public class User {
/**
* ID
*/
@Id
private Integer id;
/**
* 用户名称
*/
private String name;
/**
* 年龄
*/
private String age;
/**
* 地址
*/
private String address;
/**
* 创建时间
*/
private Date createDate;
}
加上Document注解, 指定index为business, type为user。
新建com.mirson.spring.boot.elastic.repository.UserRepository
@Repository
public interface UserRepository extends ElasticsearchRepository<User,Integer> {
/**
* 根据名称查找对象, 模糊匹配
* @param name
* @return
*/
List<User> findByNameLike(String name);
}
提供根据名称查找用户对象的接口, 支持模糊查询,Repository还提供更多用法, 详情参考以下表格:
| 关键词 | 示例 | Elasticsearch查询字符串 |
|---|---|---|
And | findByNameAndPrice | {"bool" : {"must" : [ {"field" : {"name" : "?"}}, {"field" : {"price" : "?"}} ]}} |
Or | findByNameOrPrice | {"bool" : {"should" : [ {"field" : {"name" : "?"}}, {"field" : {"price" : "?"}} ]}} |
Is | findByName | {"bool" : {"must" : {"field" : {"name" : "?"}}}} |
Not | findByNameNot | {"bool" : {"must_not" : {"field" : {"name" : "?"}}}} |
Between | findByPriceBetween | {"bool" : {"must" : {"range" : {"price" : {"from" : ?,"to" : ?,"include_lower" : true,"include_upper" : true}}}}} |
LessThanEqual | findByPriceLessThan | {"bool" : {"must" : {"range" : {"price" : {"from" : null,"to" : ?,"include_lower" : true,"include_upper" : true}}}}} |
GreaterThanEqual | findByPriceGreaterThan | {"bool" : {"must" : {"range" : {"price" : {"from" : ?,"to" : null,"include_lower" : true,"include_upper" : true}}}}} |
Before | findByPriceBefore | {"bool" : {"must" : {"range" : {"price" : {"from" : null,"to" : ?,"include_lower" : true,"include_upper" : true}}}}} |
After | findByPriceAfter | {"bool" : {"must" : {"range" : {"price" : {"from" : ?,"to" : null,"include_lower" : true,"include_upper" : true}}}}} |
Like | findByNameLike | {"bool" : {"must" : {"field" : {"name" : {"query" : "?*","analyze_wildcard" : true}}}}} |
StartingWith | findByNameStartingWith | {"bool" : {"must" : {"field" : {"name" : {"query" : "?*","analyze_wildcard" : true}}}}} |
EndingWith | findByNameEndingWith | {"bool" : {"must" : {"field" : {"name" : {"query" : "*?","analyze_wildcard" : true}}}}} |
Contains/Containing | findByNameContaining | {"bool" : {"must" : {"field" : {"name" : {"query" : "**?**","analyze_wildcard" : true}}}}} |
In | findByNameIn(Collection<String>names) | {"bool" : {"must" : {"bool" : {"should" : [ {"field" : {"name" : "?"}}, {"field" : {"name" : "?"}} ]}}}} |
NotIn | findByNameNotIn(Collection<String>names) | {"bool" : {"must_not" : {"bool" : {"should" : {"field" : {"name" : "?"}}}}}} |
Near | findByStoreNear | Not Supported Yet ! |
True | findByAvailableTrue | {"bool" : {"must" : {"field" : {"available" : true}}}} |
False | findByAvailableFalse | {"bool" : {"must" : {"field" : {"available" : false}}}} |
OrderBy | findByAvailableTrueOrderByNameDesc | {"sort" : [{ "name" : {"order" : "desc"} }],"bool" : {"must" : {"field" : {"available" : true}}}} |
新建com.mirson.spring.boot.elastic.controller.UserController
@RestController
@Log4j2
public class UserController {
@Autowired
private UserRepository userRepository;
/**
* 添加用户
* @param user
* @return
*/
@RequestMapping("/add")
public String add(User user) {
log.info("Process in add method. user: " + user);
User result = userRepository.save(user);
log.info(" add result : " + result);
return "add success.";
}
...
}
如果不指定ID, 则会新增数据; 指定ID参数, 将会进行更新操作。
com.mirson.spring.boot.elastic.controller.UserController增加:
/**
* 查找用户
* @param name
* @return
*/
@RequestMapping("/find")
public List<User> find(String name) {
log.info("Process in find method. name: " + name);
List<User> user = userRepository.findByNameLike(name);
return user;
}
com.mirson.spring.boot.elastic.controller.UserController增加:
/**
* 删除用户
* @return
*/
@RequestMapping("/del")
public String del(Integer id) {
log.info("Process in del method. id: " + id);
userRepository.deleteById(id);
return "delete success. ";
}
UserRepository
增加接口:
/**
* 获取所有对象
* @param pageable
* @return
*/
Stream<User> streamAllByNameLike(String name);
对于大数据量情况下, 可以采用Stream流式处理, 使用完必须要释放资源, 可以通过Java 7的 try-with-resources来自动处理。 不同流式用法参照:
@Query("select u from User u")
Stream<User> findAllByCustomQueryAndStream();
Stream<User> readAllByFirstnameNotNull();
@Query("select u from User u")
Stream<User> streamAllPaged(Pageable pageable);
Web接口
com.mirson.spring.boot.elastic.controller.UserController
/**
* 流式查询
* @param name
* @return
*/
@RequestMapping("/stream")
public String stream(String name) {
log.info("Process in stream method. name: " + name);
StringBuffer sbf = new StringBuffer();
// try-with-resources 处理资源, 自动关闭stream流资源
try (Stream<User> stream = userRepository.streamAllByNameLike(name)) {
stream.forEach(user -> {
sbf.append("userName: ").append(user.getName()).append(",");
});
}
return sbf.toString().replaceAll(",$", "");
}
采用 try-with-resources方式, 自动释放流资源。
UserRepository
增加接口:
/**
* 自定义查询, 根据用户名称获取对象
* @param name
* @return
*/
@Query("{\"bool\" : {\"must\" : {\"match\" : {\"name\" : \"?0\"}}}}")
List<User> customByName(String name);
自定义根据名称查询, 完全匹配模式。
Web接口
com.mirson.spring.boot.elastic.controller.UserController增加:
/**
* 自定义查询
* @param name
* @return
*/
@RequestMapping("/custom")
public List<User> custom(String name) {
log.info("Process in custom method. name: " + name);
List<User> user = userRepository.customByName(name);
return user;
}
UserRepository
增加接口:
/**
* 异步查询, 根据名称获取对象
* @param name
* @return
*/
@Async
Future<User> findOneByName(String name);
加上Async注解, 返回对象采用Futrue包装。
其他用法示例参照:
@Async
Future<User> findByFirstname(String firstname);
@Async
CompletableFuture<User> findOneByFirstname(String firstname);
@Async
ListenableFuture<User> findOneByLastname(String lastname);
Web层接口
UserController增加:
/**
* 异步查询
* @param name
* @return
*/
@RequestMapping("/async")
public List<User> async(String name) throws Exception {
log.info("Process in async method. name: " + name);
Future<User> userTask = userRepository.findOneByName(name);
User user = userTask.get();
return Arrays.asList(user);
}
新增功能
创建ID为1, 名称为user1, 年龄为21, 地址为广东省深圳市宝安区1的数据

创建成功。
更新功能
修改名称为user对象, 将年龄由21改为31, 注意ID必须指定正确。

返回成功。
查询功能
查询名称为user1的对象

成功返回数据, 年龄已修改为31。
删除功能
根据ID进行删除, 将ID为1的数据删除。

再次查询: 
数据不存在。
先创建三条数据。
流式查询

将三条数据成功输出。
自定义查询

成功找到user1对象。
异步查询

根据指定参数, 成功找到user2对象。
这里通过对spring-boot-starter-data-elasticsearch组件的使用, 掌握了Spring Boot与 ES的集成用法, 实现基本的CURD功能, 同时掌握一些高级特性, 比如流式查询和异步查询等。这些功能基本可以满足大多数项目中的使用, 更多高级特性可以再深入研究 Spring Data ElasticSearch官方手册。
我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div
我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看rubyzip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
很好奇,就使用rubyonrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提
假设我做了一个模块如下:m=Module.newdoclassCendend三个问题:除了对m的引用之外,还有什么方法可以访问C和m中的其他内容?我可以在创建匿名模块后为其命名吗(就像我输入“module...”一样)?如何在使用完匿名模块后将其删除,使其定义的常量不再存在? 最佳答案 三个答案:是的,使用ObjectSpace.此代码使c引用你的类(class)C不引用m:c=nilObjectSpace.each_object{|obj|c=objif(Class===objandobj.name=~/::C$/)}当然这取决于
我正在尝试使用ruby和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。
我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t
对于具有离线功能的智能手机应用程序,我正在为Xml文件创建单向文本同步。我希望我的服务器将增量/差异(例如GNU差异补丁)发送到目标设备。这是计划:Time=0Server:hasversion_1ofXmlfile(~800kiB)Client:hasversion_1ofXmlfile(~800kiB)Time=1Server:hasversion_1andversion_2ofXmlfile(each~800kiB)computesdeltaoftheseversions(=patch)(~10kiB)sendspatchtoClient(~10kiBtransferred)Cl
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h