加载中

超参数优化

Elastic Stack Serverless

创建用于分类或回归分析的数据帧分析作业时,存在称为超参数的高级配置选项。理想的超参数值因数据集而异。因此,默认情况下,作业通过超参数优化过程来计算最佳值组合。

超参数优化涉及多个分析轮次。每一轮使用不同的超参数值组合,这些组合是通过随机搜索和贝叶斯优化技术相结合确定的。如果您明确设置了某个超参数,则该值不会被优化,并在每一轮中保持不变。为了确定哪一轮产生了最佳结果,会使用分层 K 折交叉验证方法来分割数据集、训练模型并计算其在验证数据上的性能。

您可以通过展开 Kibana 中的作业详情或使用 get trained models API 查看最终选择的超参数值。您还可以使用 get data frame analytics analytics job stats API 查看用于比较优化每一轮的具体验证损失类型(例如均方误差或二项交叉熵)。

不同的超参数可能对模型性能产生不同程度的影响。为了估计优化超参数的重要性,使用了方差分析分解。由此产生的 `absolute importance`(绝对重要性)显示了超参数的变化对验证损失变化的贡献程度。此外,还会计算 `relative importance`(相对重要性),它表示该超参数相对于其他可调超参数的重要性。所有相对重要性的总和为 1。您可以在 get data frame analytics analytics job stats API 的响应中查看这些结果。

提示

除非您完全了解某个超参数的用途,否则强烈建议您将其保持未设置状态,并允许进行超参数优化。

© . This site is unofficial and not affiliated with Elasticsearch BV.