在谷歌速成班上,可以这样说:
如果我们从这两个特性( 一天中X型行为时间 )中构建一个特性交叉,那么我们最终将比单独使用这两个特性都具有更强的预测能力。例如,如果一只狗在下午5点时(高兴地)哭,主人下班回来时,很可能是主人满意的积极预测因素。当主人睡得很香的时候,凌晨3点哭(也许是悲惨的)很可能是业主满意的一个强烈的负面预测因素。
为什么交叉特征比把它们作为个人特征要好呢?
发布于 2019-01-21 16:17:48
它不一定是交叉特征。实际上,它是一个一般概念的子集,即内核技巧。使用内核技巧,您将能够找到比通常的超平面更复杂的决策边界,这些超平面可以通过当前特征空间的线性组合找到。假设您有一个特性x。通过使用该方法,您将能够将一行作为两个类的分隔符。如果将x^2与x一起添加,您将能够有一个抛物线决策边界,而不是一条简单的线,这使您能够在需要的情况下有一个复杂的决策边界。此外,由于x和x^2都有,所以可以将每个系数设为零,这意味着您有一种灵活性来决定是否有一条简单的直线或抛物线。
https://datascience.stackexchange.com/questions/44336
复制相似问题