简单分析器
编辑简单分析器编辑
simple
分析器将文本分解为以任何非字母字符(例如数字、空格、连字符和撇号)为分隔符的词元,丢弃非字母字符,并将大写字母转换为小写字母。
示例编辑
response = client.indices.analyze( body: { analyzer: 'simple', text: "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone." } ) puts response
POST _analyze { "analyzer": "simple", "text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone." }
simple
分析器解析句子并生成以下词元
[ the, quick, brown, foxes, jumped, over, the, lazy, dog, s, bone ]
自定义编辑
要自定义 simple
分析器,请复制它以创建自定义分析器的基础。可以根据需要修改此自定义分析器,通常是通过添加词元过滤器。
response = client.indices.create( index: 'my-index-000001', body: { settings: { analysis: { analyzer: { my_custom_simple_analyzer: { tokenizer: 'lowercase', filter: [] } } } } } ) puts response