【elasticsearch】查询结果 高亮显示

➜  esshell cat highlight.sh 
#curl -XPUT 'localhost:9200/blogs' -d'
#{
#  "mappings": {
#    "blog": {
#      "properties": {
#        "title": {
#          "type": "string",
#          "analyzer": "ik_max_word"
#        },
#        "content": {
#          "type": "string",
#          "analyzer": "ik_max_word"
#        }
#      }
#    }
#  }
#}';
#
#curl -XPOST 'http://localhost:9200/blogs/blog/1' -d '
#{
#"title":"我的第一篇博客",
#"content":"大家好,这是我写的第一篇博客,特别喜欢这个博客网站"
#}
#'
curl -XPOST 'http://localhost:9200/blogs/blog/_search' -d '
{
    "query":{
        "bool":{
            "should":[
                {
                    "match":{
                        "title":"第一"
                    }
                },
                {
                    "match":{
                        "content":"博客网站"
                    }
                }
            ]
        }
    },
    "from":0,
    "size":10,
    "highlight":{
        "fields":{
            "title":{

            },
            "content":{

            }
        }
    }
}'

https://blog.csdn.net/wuzhiwei549/article/details/80522832

https://www.cnblogs.com/yuanyongqiang/p/11891736.html

总的来说:三种高亮显示
一、plain highlight(默认)
二、posting highlight(性能)
   对磁盘的消耗更少
   将文本切割为句子,并且对句子进行高亮,效果更好
   性能比plain highlight高,因为不需要重新对高亮文本进行分词
三、fast vector highlight(文件)
   对大文件而言(大于1M),性能更高

代码时间
默认创建索引时添加分词

按 Ctrl+C 复制代码
按 Ctrl+C 复制代码

查询

 

 

如果包含了那个搜索词的话,就会在那个field的文本中,对搜索词进行红色的高亮显示

posting highlight

创建索引时在要搜索的字段添加”index_options”: “offsets”

复制代码
PUT /blog_website
{ "mappings": { "blogs": { "properties": { "title": { "type": "text", "analyzer": "ik_max_word" }, "content": { "type": "text", "analyzer": "ik_max_word", "index_options": "offsets" }
      }
    }
  }
}
复制代码

fast vector highlight

建索引时term vector设置在mapping中

 

复制代码
PUT /blog_website
{ "mappings": { "blogs": { "properties": { "title": { "type": "text", "analyzer": "ik_max_word" }, "content": { "type": "text", "analyzer": "ik_max_word", "term_vector" : "with_positions_offsets" }
      }
    }
  }
}
复制代码

 

自定义:

强制使用某种高亮:指定type

复制代码
GET /blog_website/blogs/_search 
{ "query": { "match": { "content": "博客" }
  }, "highlight": { "fields": { "content": { "type": "plain"//强制使用某种highlighter
      }
    }
  }
}
复制代码

设置高亮标签,取代<em>

 "pre_tags": ["<tag1>"], "post_tags": ["</tag2>"],

如下:

复制代码
GET /blog_website/blogs/_search 
{ "query": { "match": { "content": "博客" }
  }, "highlight": { "pre_tags": ["<tag1>"], "post_tags": ["</tag2>"], "fields": { "content": { "type": "plain" }
    }
  }
}
复制代码

设置文本片段:长度、个数

复制代码
GET /_search
{ "query" : { "match": { "user": "kimchy" }
    }, "highlight" : { "fields" : { "content" : {"fragment_size" : 150, "number_of_fragments" : 3, "no_match_size": 150 }
        }
    }
}

fragment_size: 将要显示的文本拆成*长的一段来进行显示
    (设置要显示出来的文本片段的长度,默认是100)

number_of_fragments:可能高亮的文本片段有多个片段,指定显示几个片段
复制代码

    A+
发布日期:2020年05月13日  所属分类:未分类

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: