十进制数字标记过滤器
编辑十进制数字标记过滤器编辑
将 Unicode Decimal_Number
通用类别中的所有数字转换为 0-9
。例如,该过滤器将孟加拉语数字 ৩
更改为 3
。
此过滤器使用 Lucene 的 DecimalDigitFilter。
示例编辑
以下 分析 API 请求使用 decimal_digit
过滤器将 Devanagari 数字转换为 0-9
response = client.indices.analyze( body: { tokenizer: 'whitespace', filter: [ 'decimal_digit' ], text: '१-one two-२ ३' } ) puts response
GET /_analyze { "tokenizer" : "whitespace", "filter" : ["decimal_digit"], "text" : "१-one two-२ ३" }
该过滤器生成以下标记
[ 1-one, two-2, 3]
添加到分析器编辑
以下 创建索引 API 请求使用 decimal_digit
过滤器来配置一个新的 自定义分析器。
response = client.indices.create( index: 'decimal_digit_example', body: { settings: { analysis: { analyzer: { whitespace_decimal_digit: { tokenizer: 'whitespace', filter: [ 'decimal_digit' ] } } } } } ) puts response
PUT /decimal_digit_example { "settings": { "analysis": { "analyzer": { "whitespace_decimal_digit": { "tokenizer": "whitespace", "filter": [ "decimal_digit" ] } } } } }