# filter 与 query 深入对比解密：相关度、性能

# filter 与 query 示例

先来插入几条数据

PUT /company/employee/2
{
  "address": {
    "country": "china",
    "province": "jiangsu",
    "city": "nanjing"
  },
  "name": "tom",
  "age": 30,
  "join_date": "2016-01-01"
}

PUT /company/employee/3
{
  "address": {
    "country": "china",
    "province": "shanxi",
    "city": "xian"
  },
  "name": "marry",
  "age": 35,
  "join_date": "2015-01-01"
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

搜索请求：年龄必须大于等于 30，同时 join_date 必须是 2016-01-01

GET /company/employee/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "join_date": "2016-01-01"
          }
        }
      ],
      "filter": {
        "range": {
          "age": {
            "gte": 30
          }
        }
      }
    }
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

上面这一个查询中，query 中有 filter，那么他们有什么不一样的呢？

# filter 与 query 对比大解密

filter：仅仅只是按照搜索条件过滤出需要的数据而已，不计算任何相关度分数，对相关度没有任何影响
query：会去计算每个 document 相对于搜索条件的相关度，并按照相关度进行排序

TIP

query 中除了 filter 的条件应该都会进行分数计算，而 filter 只是把数据过滤

一般来说，如果你是在进行搜索，需要将最匹配搜索条件的数据先返回，那么用 query；

如果你只是要根据一些条件筛选出一部分数据，不关注其排序，那么用 filter；

除非是你的这些搜索条件，你希望越符合这些搜索条件的 document 越排在前面返回，那么这些搜索条件要放在 query 中；

如果你不希望一些搜索条件来影响你的 document 排序，那么就放在 filter 中即可

# filter 与 query 性能

filter：不需要计算相关度分数，不需要按照相关度分数进行排序，同时还有内置的自动 cache 最常使用 filter 的数据
query：相反，要计算相关度分数，按照分数进行排序，而且无法 cache 结果

← 快速上机动手实战 Query DSL 搜索语法常用的各种 query 搜索语法 →