katakana_uppercase 分词过滤器
编辑katakana_uppercase
分词过滤器
编辑katakana_uppercase
分词过滤器将片假名中的小写字母(捨て仮名)规范化为标准字母。如果您希望搜索旧式日语文本(例如专利、法律文件、合同政策等),此过滤器很有用。
例如
PUT kuromoji_sample { "settings": { "index": { "analysis": { "analyzer": { "my_analyzer": { "tokenizer": "kuromoji_tokenizer", "filter": [ "katakana_uppercase" ] } } } } } } GET kuromoji_sample/_analyze { "analyzer": "my_analyzer", "text": "ストップウォッチ" }
结果为
{ "tokens": [ { "token": "ストツプウオツチ", "start_offset": 0, "end_offset": 8, "type": "word", "position": 0 } ] }