katakana_uppercase 词元过滤器
编辑katakana_uppercase
词元过滤器
编辑katakana_uppercase
词元过滤器将片假名中的小字母 (捨て仮名) 规范化为标准字母。如果您想搜索旧式日文文本,例如专利、法律文件、合同政策等,此过滤器非常有用。
例如
PUT kuromoji_sample { "settings": { "index": { "analysis": { "analyzer": { "my_analyzer": { "tokenizer": "kuromoji_tokenizer", "filter": [ "katakana_uppercase" ] } } } } } } GET kuromoji_sample/_analyze { "analyzer": "my_analyzer", "text": "ストップウォッチ" }
结果为
{ "tokens": [ { "token": "ストツプウオツチ", "start_offset": 0, "end_offset": 8, "type": "word", "position": 0 } ] }