resp = client.inference.put(
    task_type="text_embedding",
    inference_id="cohere_embeddings",
    inference_config={
        "service": "cohere",
        "service_settings": {
            "api_key": "<api_key>",
            "model_id": "embed-english-v3.0",
            "embedding_type": "byte"
        }
    },
)
print(resp)

const response = await client.inference.put({
  task_type: "text_embedding",
  inference_id: "cohere_embeddings",
  inference_config: {
    service: "cohere",
    service_settings: {
      api_key: "<api_key>",
      model_id: "embed-english-v3.0",
      embedding_type: "byte",
    },
  },
});
console.log(response);

PUT _inference/text_embedding/cohere_embeddings 
{
    "service": "cohere",
    "service_settings": {
        "api_key": "<api_key>", 
        "model_id": "embed-english-v3.0", 
        "embedding_type": "byte"
    }
}

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `cohere_embeddings`。
	您的 Cohere 帐户的 API 密钥。您可以在 Cohere 仪表板的 API 密钥部分中找到您的 API 密钥。您只需要提供一次 API 密钥。获取推理 API 不会返回您的 API 密钥。
	要使用的嵌入模型的名称。您可以在此处找到 Cohere 嵌入模型的列表。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `hugging_face_embeddings`。
	一个有效的 HuggingFace 访问令牌。您可以在您帐户的设置页面上找到。
	您在 Hugging Face 上创建的推理端点 URL。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `openai_embeddings`。
	您的 OpenAI 帐户的 API 密钥。您可以在您的 OpenAI 帐户的 API 密钥部分中找到您的 OpenAI API 密钥。您只需要提供一次 API 密钥。获取推理 API 不会返回您的 API 密钥。
	要使用的嵌入模型的名称。您可以在此处找到 OpenAI 嵌入模型的列表。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `azure_openai_embeddings`。
	用于访问您的 Azure OpenAI 服务的 API 密钥。或者，您可以在此处提供 `entra_id` 而不是 `api_key`。获取推理 API 不会返回此信息。
	您的 Azure 资源的名称。
	您部署的模型的 ID。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `azure_ai_studio_embeddings`。
	用于访问您部署的 Azure AI Studio 模型的 API 密钥。您可以在您的模型部署的概览页面上找到此信息。
	用于访问您部署的 Azure AI Studio 模型的目标 URI。您可以在您的模型部署的概览页面上找到此信息。
	模型提供商，例如 `cohere` 或 `openai`。
	部署的端点类型。这可以是 `token`（用于“即用即付”部署），或者 `realtime`（用于实时部署端点）。

	路径中的任务类型为 `text_embedding`。`google_vertex_ai_embeddings` 是推理端点的唯一标识符（其 `inference_id`）。
	适用于 Google Vertex AI API 的 JSON 格式的有效服务帐户。
	有关可用模型的列表，请参阅文本嵌入 API 页面。
	要用于推理任务的位置名称。有关可用位置，请参阅 Vertex AI 上的生成式 AI 位置。
	要用于推理任务的项目名称。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `mistral_embeddings`。
	用于访问 Mistral API 的 API 密钥。您可以在 Mistral 帐户的 API 密钥页面中找到它。
	Mistral 嵌入模型的名称，例如 `mistral-embed`。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `amazon_bedrock_embeddings`。
	访问密钥可以在您的 AWS IAM 管理页面中找到，用于用户帐户访问 Amazon Bedrock。
	密钥应是指定访问密钥的配对密钥。
	指定您的模型所在的区域。
	指定模型提供商。
	要使用的模型的模型 ID 或 ARN。

	路径中的任务类型为 `text_embedding`，推理端点的唯一标识符 `inference_id` 为 `alibabacloud_ai_search_embeddings`。
	用于访问阿里云 AI 搜索 API 的 API 密钥。您可以在您的阿里云帐户的 API 密钥部分中找到您的 API 密钥。您只需提供一次 API 密钥。获取推理 API 不会返回您的 API 密钥。
	阿里云 AI 搜索嵌入模型的名称，例如 `ops-text-embedding-zh-001`。
	您的阿里云 AI 搜索主机地址的名称。
	您的阿里云 AI 搜索工作区的名称。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。在您使用的模型的 Cohere 文档中查找此值。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的嵌入的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含嵌入的字段是一个 `dense_vector` 字段。
	模型的输出维度。此值可以在 Google Vertex AI 模型参考中找到。如果未指定 `dims`，则推理 API 会尝试自动计算输出维度。
	对于 Google Vertex AI 嵌入，应使用 `dot_product` 函数来计算相似度。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为 `text`。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。此值可能因使用的基础模型而异。请参阅 Amazon Titan 模型或 Cohere 嵌入模型文档。
	对于 Amazon Bedrock 嵌入，对于 Amazon Titan 模型，应使用 `dot_product` 函数来计算相似度，对于 Cohere 模型，应使用 `cosine` 函数。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	您使用创建推理 API 创建的推理端点的名称，在该步骤中称为 `inference_id`。
	配置对象，定义推理过程的 `input_field` 和将包含推理结果的 `output_field`。

	您使用创建推理 API 创建的推理端点的名称，在该步骤中称为 `inference_id`。
	配置对象，定义推理过程的 `input_field` 和将包含推理结果的 `output_field`。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含 ELSER 的标记的字段是一个 `sparse_vector` 字段。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。在 HuggingFace 模型文档中查找此值。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。在您使用的模型的 OpenAI 文档中查找此值。
	由于 OpenAI 嵌入已归一化为单位长度，因此可以使用更快的 `dot_product` 函数来计算相似度。您可以查看 OpenAI 文档，了解应使用哪种相似度函数。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。在您使用的模型的 Azure OpenAI 文档中查找此值。
	对于 Azure OpenAI 嵌入，应使用 `dot_product` 函数来计算相似度，因为 Azure OpenAI 嵌入已归一化为单位长度。有关模型规范的更多信息，请参阅 Azure OpenAI 嵌入文档。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。此值可以在您的 Azure AI Studio 部署的模型卡片中找到。
	对于 Azure AI Studio 嵌入，应使用 `dot_product` 函数来计算相似度。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。此值可以在 Mistral 模型参考中找到。
	对于 Mistral 嵌入，应使用 `dot_product` 函数来计算相似度。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

	包含生成的标记的字段的名称。它必须在下一步的推理管道配置中被引用。
	包含标记的字段是一个 `dense_vector` 字段。
	模型的输出维度。此值可能因使用的基础模型而异。请参阅阿里云 AI 搜索嵌入模型文档。
	从中创建密集向量表示的字段的名称。在此示例中，字段的名称为 `content`。它必须在下一步的推理管道配置中被引用。
	此示例中的字段类型为文本。

The Search AI Company

Generative AI

Search

Security

Observability

By solution

Industries

教程：使用推理 API 进行语义搜索

教程：使用推理 API 进行语义搜索

要求

创建推理端点

创建索引映射

使用推理处理器创建索引管道

加载数据

通过推理索引管道索引数据

语义搜索

交互式教程

Follow us

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards