首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >制造歧义数据集

制造歧义数据集
EN

Stack Overflow用户
提问于 2017-02-01 21:27:05
回答 1查看 56关注 0票数 0

我希望这样的问题属于这里。这就是我现在正在处理的问题:我有一些从制造过程中收集的数据(传感器数据,过程参数等)。对于每一个离开生产线的零件,我知道它是否是报废的。因此,对于每个零件,我都有它的过程数据和质量(0:好,1:坏)

我的目标是优化制造过程,即找到最优的工艺参数,以产生最少的废品量。

到目前为止我所做的:我尝试了不同的分类算法(随机森林,支持向量机,神经网络),但没有一个能够达到很好的准确性。我认为原因是数据非常模糊,也就是说,如果我有相同工艺参数的零件,其中一些可能是报废的,而另一些可能是好的。但质量和工艺参数之间肯定有联系。我现在想要的是预测一个零件是好是坏的“概率”。我想估计概率密度吗?我能用K近邻做这件事吗?

EN

回答 1

Stack Overflow用户

发布于 2017-02-03 01:10:17

您可以尝试的一个步骤是,对每个参数进行估计

,其中x是参数值,

是好/坏的指示器变量。

有一种可能

没有坚持任何特定的分布,不知道他们采取的价值观的类型,对我来说很难提出建议。

一种“无模型”的方法是,给定一组n个观察值

,“离散化”参数x,以便

然后您可以通过以下方式估计pmf

对于“坏”的情况也是如此。

在你有了

对于每个参数,您可以计算该参数的“好”和“坏”情况之间的相对熵/KL散度。那些在两个类之间有较大差异的参数是最重要的参数,它们的pmfs有望向您显示哪些值表示性能不佳。

当然,这是假设参数iid,实际上它们可能不是,但是可以通过考虑不是独立的和相应地离散化的协同参数来执行类似的过程。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41980991

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档