业内目前来说事实上的一个标准,就是分布式搜索引擎一般大家都用elasticsearch
lucene
如果你确实真的不连lucene都不知道是什么?我觉得你确实不应该,lucene底层的原理是一个东西,叫做倒排索引。太基础了。
百度,搜索一下lucene入门,了解一下lucene是什么?倒排索引是什么?全文检索是什么?写个lucene的demo程序体验一把。
elasticsearch
百度,搜索一下:elasticsearch入门,初步至少知道es的一些基本概念,然后包括es的基本部署和基本的使用
面试官可能会怎么问?
(1)es的分布式架构原理能说一下么(es是如何实现分布式的啊)?
(2)es写入数据的工作原理是什么啊?es查询数据的工作原理是什么啊?
(3)es在数据量很大的情况下(数十亿级别)如何提高查询性能啊?
(4)es生产集群的部署架构是什么?每个索引的数据量大概有多少?每个索引大概有多少个分片?
参考
《Java工程师面试突击第1季-中华石杉老师》