Elasticsearch 8.14 新特性
编辑Elasticsearch 8.14 新特性编辑
8.14 中的新功能。
以下是 Elasticsearch 8.14 中的新增功能和改进亮点!有关此版本的详细信息,请参阅 发行说明 和 迁移指南。
其他版本
8.13 | 8.12 | 8.11 | 8.10 | 8.9 | 8.8 | 8.7 | 8.6 | 8.5 | 8.4 | 8.3 | 8.2 | 8.1 | 8.0
查询阶段 KNN 现在支持 query_vector_builder编辑
现在可以在 查询 DSL 中的 knn
查询中传递 model_text
和 model_id
,将文本查询转换为密集向量并在其上运行最近邻查询,而不是要求直接传递密集向量(在 query_vector
参数中)。类似于 顶级 knn 查询(在 DFS 阶段执行),可以提供一个 query_vector_builder
对象,其中包含一个 text_embedding
对象,该对象包含 model_text
(要转换为密集向量的文本查询)和 model_id
(负责将文本查询转换为密集向量的已部署模型的标识符)。请注意,需要在集群中的 ML 节点上部署 具有引用 model_id
的嵌入模型。
已添加用于合并 int8 标量量化向量的 SIMD(Neon)优化向量距离函数编辑
已添加针对 aarch64 的优化 int8 向量距离实现。此实现目前仅在合并期间使用。对于二进制比较,向量距离实现的性能优于 Lucene 的 Pamana 向量实现约 5 倍(取决于维数)。它是通过将 SIMD(Neon)内在函数编译到单独的本机库并通过 Panama 的 FFI 进行链接来实现的。比较是在堆外 mmap 的向量数据上执行的。宏基准测试,SO_Dense_Vector 启用了标量量化,显示合并时间显着提高,速度提高了大约 3 倍。
预览:geoip 处理器支持匿名 IP 和企业数据库编辑
作为技术预览,geoip
处理器现在可以使用 MaxMind 的商业 GeoIP2 企业 和 GeoIP2 匿名 IP 数据库。