vocabulary: (数组) 模型词汇表。不能为空。
merges: (可选，数组) 字节对编码中使用的模型合并。合并必须是子标记对，以空格分隔，并按优先级排序。示例：["f o", "fo o"]。必须为 RoBERTa 和 BART 风格的模型提供。
scores: (可选，数组) sentence-piece 分词使用的词汇表值分数。必须与 vocabulary 的长度相同。对于像 XLMRoberta 和 T5 这样的 unigram sentence-piece 分词模型是必需的。

示例

编辑

以下示例演示如何为先前存储的训练模型配置创建模型词汇表。

PUT _ml/trained_models/elastic__distilbert-base-uncased-finetuned-conll03-english/vocabulary
{
  "vocabulary": [
    "[PAD]",
    "[unused0]",
    ...
  ]
}

API 返回以下结果

{
    "acknowledged": true
}

« 创建训练模型 API 删除训练模型别名 API »