超参数优化
Elastic Stack Serverless
当您为分类或回归分析创建数据框分析作业时,有一些高级配置选项,称为超参数。理想的超参数值因数据集而异。因此,默认情况下,作业通过超参数优化过程计算值的最佳组合。
超参数优化涉及多轮分析。 每轮分析都涉及超参数值的不同组合,这些组合通过随机搜索和贝叶斯优化技术的组合确定。 如果您显式设置超参数,则该值不会被优化,并且在每一轮中都保持不变。 为了确定哪一轮产生最佳结果,分层 K 折交叉验证方法用于拆分数据集、训练模型并计算其在验证数据上的性能。
您可以通过在 Kibana 中展开作业详细信息或使用 get trained models API 来查看最终选择的超参数值。 您还可以使用 get data frame analytics analytics job stats API 查看用于比较每轮优化的特定类型的验证损失(例如均方误差或二项交叉熵)。
不同的超参数可能会对模型性能产生不同程度的影响。为了估计优化后的超参数的重要性,使用了方差分解分析。得到的 absolute importance
显示了超参数的变化对验证损失的变化的影响程度。 此外,还计算了relative importance
,它给出了超参数与其余可调整超参数相比的重要性。 所有相对重要性之和为 1。 您可以在 get data frame analytics analytics job stats API 的响应中查看这些结果。
提示
除非您完全了解超参数的目的,否则强烈建议您将其保留为未设置状态,并允许进行超参数优化。