关键词分词器
编辑关键词分词器编辑
keyword
分词器是一个“无操作”分词器,它接受任何给定的文本并输出完全相同的文本作为单个词条。它可以与词条过滤器结合使用来规范输出,例如将电子邮件地址转换为小写。
示例输出编辑
response = client.indices.analyze( body: { tokenizer: 'keyword', text: 'New York' } ) puts response
POST _analyze { "tokenizer": "keyword", "text": "New York" }
上面的句子将产生以下词条
[ New York ]
与词条过滤器结合使用编辑
您可以将 keyword
分词器与词条过滤器结合使用来规范结构化数据,例如产品 ID 或电子邮件地址。
例如,以下 分析 API 请求使用 keyword
分词器和 lowercase
过滤器将电子邮件地址转换为小写。
response = client.indices.analyze( body: { tokenizer: 'keyword', filter: [ 'lowercase' ], text: '[email protected]' } ) puts response
POST _analyze { "tokenizer": "keyword", "filter": [ "lowercase" ], "text": "[email protected]" }
该请求产生以下词条
配置编辑
keyword
分词器接受以下参数
|
一次读取到词条缓冲区中的字符数。默认为 |