智慧生物的大规模协作造就了惊人的进化奇迹。大规模机器集群造就机器系统进化成为强大的智能系统。Elasticsearch作为大数据与搜索引擎技术的结合体,随着社会对大规模开源分布式搜索引擎的需求迅速成长。
本篇文章从基本概念开始熟悉Elasticsearch,接下来介绍了Elasticsearch在 Windows和Linux操作系统下的安装。除了CURL命令,介绍了使用常用的编程工具和Elasticsearch 搜索服务交互,包括Java、Python、Scala和 PHP,以及使用SQL语句查诲Elasticsearch 索引的方法。自然语言文本理解往往以插件形式存在于Elasticsearch集群中。
第2章介绍了如何开发与测试插件。因为 Elasticsearch经常用于实时搜索或分析,所以性能优化很重要。第3章介绍了如何管理 Elasticsearch 集群。为了更合理地使用和扩展Elasticsearch,第4章简单分析了 github 中托管的Elasticsearch源代码。对于搜索引擎来说,返回结果的相关性是一个重要的话题,第5章讨论了这个问题。第6章介绍了使用Java开发搜索引擎Web 用户界面的几种方法。
随着人工智能领域技术的发展,让搜索引擎智能加速变成现实。智能搜索引擎需要能够检测到并识别出图像中的文字,第7章介绍了结合OpenCV使用Tesseract 识别文字的方法。第8章介绍了根据问题返回搜索结果的问答式搜索。目前 Elasticsearch是实时系统监控的首选,第9章介绍了使用Elasticsearch 监控与分析日志,也介绍了通过物联网监控系统的方案。
因为文章篇幅问题,以下就展示了部分截图,需要全文PDF文档的小伙伴点赞+转发之后,【点击此处】即可免费获取完整pdf
第1章 使用Elasticsearch
- 1.1 基本概念
- 1.2 安装
- 1.3 搜索集群
- 1.4 创建索引
- 1.5 使用Java客户端接口
- 1.6 RESTClient
- 1.7 使用Jest
- 1.8 Python客户端
- 1.9 Scala客户端
- 1.10 PHP客户端
- 1.11 SQL支持
- 1.12 本章小结
第2章 开发插件
- 2.1 搜索中文
- 2.2 搜索英文
- 2.3 使用测试套件
- 2.4 本章小结
第3章 管理搜索集群
- 3.1 节点类型
- 3.2 管理集群
- 3.3 写入权限控制
- 3.4 使用X-Pack
- 3.5 快照
- 3.6 Zen发现机制
- 3.7 联合搜索
- 3.8 缓存
- 3.9 本章小结
第4章 源码分析
- 4.1 Lucene源码分析
- 4.2 Gradle
- 4.3 Guice
- 4.4 Joda-Time
- 4.5 Transport
- 4.6 线程池
- 4.7 模块
- 4.8 Netty
- 4.9 分布式
- 4.10 本章小结
因为文章篇幅问题,以下就展示了部分截图,需要全文PDF文档的小伙伴点赞+转发之后,【点击此处】即可免费获取完整pdf
第5章 搜索相关性
- 5.1 BM25检索模型
- 5.2 学习评分
第6章 搜索引擎用户界面
- 6.1 JSP实现搜索界面
- 6.2 使用Spring实现的搜索界面
- 6.3 实现搜索接口
- 6.4 实现相似文档搜索
- 6.5 实现AJAX搜索联想词
- 6.6 推荐搜索词
- 6.7 查询意图理解
- 6.8 集成其他功能
- 6.9 查询分析
- 6.10 部署网站
第7章 OCR文字识别
- 7.1 Tesseract
- 7.2 使用TensorFlow识别文字
- 7.3 OpenCV
- 7.4 JavaCV
- 7.5 本章小结
第8章 问答式搜索
- 8.1 生成表示语义的代码
- 8.2 信息整合
- 8.3 自动问答
- 8.4 本章小结
第9章 Elastic系统监控
- 9.1 Logstash
- 9.2 Filebeat
- 9.3 消息过期
- 9.4 Kibana
- 9.5 Flume
- 9.6 Kafka
- 9.7 Graylog
- 9.8 物联网数据
- 9.9 本章小结
因为文章篇幅问题,以下就展示了部分截图,需要全文PDF文档的小伙伴点赞+转发之后,【点击此处】即可免费获取完整pdf