首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从核密度估计中获取核特性(sklearn)

从核密度估计中获取核特性(sklearn)
EN

Stack Overflow用户
提问于 2020-05-27 20:05:14
回答 1查看 172关注 0票数 1

滑雪范例中,合成的数据来自两个高斯分布的加权抽样,[0,1][5, 1]的均值和std分别占30%和70%。假设使用gaussian内核和bandwidth=1,我们得到了以下结果( KDE估计器的输出与列车数据相匹配):

是否有可能(从数学上和实际上)恢复估计核的特性?例如,在这种情况下,我们从拟合模型中读取[0,1][5, 1]值?(假设适当地完成了拟合过程)

EN

回答 1

Stack Overflow用户

发布于 2022-03-29 04:51:41

不这是不可能的。

sklearn类只允许(1)采样新的数据点,(2)计算模型下的日志似然。在您的示例中,您可以通过眼睛读取高斯混合模型的均值和标准差,但这与核密度估计下的算法无关。

sklearn算法的标准工作流程如下:

  1. 用所选的超参数实例化KDE实例(特别是提供内核和带宽)。
  2. fit()方法将训练数据集分配给KDE实例。这里的文档:https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KernelDensity.html#sklearn.neighbors.KernelDensity.fit
  3. sample()方法通过以下方式生成新的数据点:(i)首先随机选择训练数据集中的数据点x;(ii)从以x为中心的正态分布中抽取一个随机实例,其中以标准偏差h ( h是您的KDE带宽)为中心。
  4. 使用score()score_sample()计算模型下生成的样本的日志可能性。

因此,不存在“估计核的特性”这样的东西。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62051931

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档