ElasticSearch大文本搜索的最佳实践

本周我们很荣幸邀请到了Kevin Zhao给我们带来了关于ElasticSearch的介绍,相关内容总结如下:

Slides

Kevin使用的slides

Q&A

相关Q&A内容总结如下:

什么是X-Pack?

  1. X-pack提供了security,alerting,monitoring,reporting,machine learing以及其它的一些功能,原来是不开源的Elastic Stack(ElastiSearch, Kibana,Beats和Logstash)中的一员,它其中的一些feature比如monitoring是免费的,另外一些比如Machine learning是付费的。不过现在X-pack的代码也开源了,具体的开源情况如下图所示:
  2. 【扩展】官网关于X-Pack的详细介绍:包括了X-Pack的介绍和它包含的各个模块的使用介绍。

什么是Beats?

  1. Beats简单来说就是用来收集日志或者metric,然后发送给LogStash或者ES。它可以收集各种数据,比如filebeat,packetbeat,metricbeat等等。
  2. 【扩展】官网关于Beats的介绍文档:了解beats的首选。
  3. 【扩展】一篇比较基础的Beats介绍文章:《Elastic Beats介绍

什么是Logstash?

  1. LogStash同样是Elastic Stack中的一员,他是一个开源的数据处理管道,说白了就是可以从不同数据源获取数据,对其进行转换,然后发送到不同的目的地。
  2. 【扩展】Logstash 实用介绍:这篇文章比较详细介绍了如何使用LogStash包括一些定制配置,以及最终如何写入到ES的例子。
  3. 【扩展】Logstash介绍:同样的一篇使用Logstash的示例文章,大家如果想自己试试,可以参考。

Solr和ES的比较

  1. 按照Google的搜索热度来看,在13年后ES就比solr越来越流行且保持着上升的势头,而solr整体开始有下降的趋势。
  2. 【扩展】Solr vs. Elasticsearch:这是一篇2020年七月份的文章,从安装,查询,index,salability, cluster以及comunity,documentation几个方面进行了比较。
  3. 【扩展】Solr vs. Elasticsearch: Performance Differences & More. How to Decide Which One is Best for You:这篇文章的比较方面更加深入和广泛,包含了community,node discovery,shared placement,Cache等等十几个方面进行了比较。
  4. 【扩展】为什么我们选用ElasticSearch而不用solr:这是一篇中文博客,其引用的文章也值得大家一看。

ElasticSearch是如何处理拼写错误的?

  1. 可以参考东哥的这篇博客:ElasticSearch进阶之拼写错误

其它相关资料

  1. 我们上次关于ElasticSearch的讲座总结
  2. 东哥的ElasticSearch系列文章

再次感谢大家的参与,也希望大家有好的资源能联系我更新这篇文章。谢谢大家。

下周话题安排和往期话题回顾敬请参见《系统设计开荒小分队话题讨论简介

You may also like...

Leave a Reply

Your email address will not be published.