# 倒排索引核心原理快速揭秘

本节快速告诉你倒排索引的的基本原理

假设说有以下两条数据

doc1：I really liked my small dogs, and I think my mom also liked them.
doc2：He never liked any dogs, so I hope that my mom will not expect me to liked him.

插入被分词，初步的倒排索引的建立

演示了一下倒排索引最简单的建立的一个过程

TIP

真实的倒排索引比这个复杂多了，这里只是这么一个基本原理

搜索 mother like little dog，不可能有任何结果

因为会被拆分为以下几个词语，而这些词语并没有在上面第一步中初步索引中存在

这个是不是我们想要的搜索结果？？？绝对不是，因为在我们看来：

# normalization

什么是 normalization？

简单说，建立倒排索引的时候，会执行一个操作，也就是说对拆分出的各个单词进行相应的处理，以提升后面搜索的时候能够搜索到相关联的文档的概率

比如：括时态的转换，单复数的转换，同义词的转换，大小写的转换

重新建立倒排索引，加入 normalization ，再次用 mother liked little dog 搜索，就可以搜索到了

mother like little dog，分词、normalization

doc1 和 doc2 都会搜索出来