在做机器学习项目时,我们听说逻辑回归对“线性数据”很好,决策树在“非线性数据”中运行良好。
然而,线性和非线性数据的概念是没有意义的。对我来说,只有线性可分数据和非线性可分数据对我来说是有意义的,因为它是一个线性函数,因此逻辑回归对“线性可分数据”很有效。在数学中,线性函数是一次多项式,所有其他非线性函数都被认为是非线性函数。
线性数据和非线性数据究竟是什么?
发布于 2021-05-19 06:13:06
命名线性数据或非线性数据有点误导和错误,我会说。相反,变量之间存在线性关系和非线性关系,可以更好、更准确地命名.从现实生活中可以很容易地用例子来解释。
y = intercept + x^2,平方根关系:y = intercept + 6 * sqrt(x)等)。让我们想象一个我们不知道自由落体方程的世界,我们使用ML来学习和预测它:)。在这种情况下(具体的和简化的情况),算法需要在以下结构s = v₀t + (1/2)gt²中学习方程,其中t是我们的自变量,S是我们的目标或因变量,v₀,g是我们要学习的系数。换句话说,你要用时间来预测自由落体(距离或高度)。在这个虚构的世界中,牛顿万有引力(F = G * (M1 * M2) / r^2)定律,圆(A = π * r^2)的面积也将是ML的二次问题。线性函数不满足这类情况的要求,除非你使用某种变换,我们假设取牛顿定律的r^2的平方根或自由落体的t^2的平方根,然后在线性函数中使用它们。非线性现实生活关系中最著名的例子是用年龄预测身高。然而,身高以不同的速率持续变化:直到13岁逐渐增加,13-18岁之间显著增加,18-25岁之间略有变化,25岁以后没有变化。因此,不可能将其拟合成一个线性方程,因为它不依赖于单个系数或i.o.w。它不适合公式height = intercept + b * age,因为系数(b)不是常数随时间(年龄)。此外,图、树和其他类似结构也被拟合成一个非线性关系.在结果高度依赖于ifs的情况下,线性算法是无用的,因为不能将这种关系拟合到y = a + b * x中。比方说,如果你想根据棋手的移动来预测谁会赢一盘棋,你可以使用树式(例如:α-beta剪枝)算法来预测。y = a + b * x公式或甚至y = a + b1* x1 + b2*x2 + ...来解释。最简单的例子是预测在酒吧(或任何娱乐场所)花费的成本。cost = intercept (let's imagine you pay money for entering to the bar) + (the price of a drink) * (the number of drinks bought) + (the price of appetizer) * (the number of appetizers bought)将是我们的公式。https://datascience.stackexchange.com/questions/94631
复制相似问题