我想用神经网络来预测公司的破产。数据集组织如下:研究数据来自于2001年至2012年期间的160家公司(50家破产公司和110家未破产公司)。破产由一个二元变量(0=healthy,1=bankrupt)描述。例如,A公司在2001-2012年间没有破产,但B公司在2003年破产。每个公司每年大约有150个特征/输入,所以应该选择其中的一些特征,然后应该预测公司的健康状况。
现在,我不知道如何进行分类,以便考虑公司内部(趋势)和公司之间的相似性程度。准确地说,我想要考虑公司内部和公司之间特性变化的趋势。如果我的问题是时间序列分类,我应该使用哪种神经网络?递归神经网络?如果是这样,数据集应该如何在Matlab中组织。
company year Bankruptcy Feature 1 Feature 2 … … Feature 150
A 2001 0
A 2002 0
A 2003 0
A 2004 0
A 2005 0
A 2006 0
A 2007 0
A 2008 0
A 2009 0
A 2010 0
A 2011 0
A 2012 0
B 2001 0
B 2002 0
B 2003 1 诚挚的问候,
发布于 2015-11-13 18:35:51
有一些方法可以使用神经网络来实现这一点。假设它是一个时间序列,并且您有许多特征,您可以将其视为一个分类或回归问题。我不知道你的数据,我只是举个例子。
您可以提供输入层中的所有数据,并为每个样本提供理想的输出(您想要分类的特征),以训练您的神经网络模型。示例:
Company ; Year ; Feature 1 ; Feature 2 Ideal Output
1 ; 2000 ; 1 ; 1 1
2 ; 2001 ; 1 ; 2 0
3 ; 2002 ; 2 ; 4 1
4 ; 2003 ; 5 ; 0 1
5 ; 2004 ; 4 ; 1 0现在,将其用作时间序列,您可以使用预测窗口来使用它,对于smaple,您可以选择要预测的特征,并在数据之间滑动一个窗口,以估计该序列的理想输出。
假设您有一个包含这些值的时间序列
2.5 ; 2.6 ; 3.2 ; 4.6 ; 5.1 ; 5.2 ; 5.9 ; 6.4 ; 7.1 ; 8.3 ; 9.1使用3个点的预测窗口,您将拥有一个如下所示的集合:
Inputs Ideal Output
2.5 ; 2.6 ; 3.2 4.6
2.6 ; 3.2 ; 4.6 5.1
3.2 ; 4.6 ; 5.1 5.2
4.6 ; 5.1 ; 5.2 5.9
5.1 ; 5.2 ; 5.9 6.4
5.2 ; 5.9 ; 6.4 7.1
5.9 ; 6.4 ; 7.1 8.3
6.4 ; 7.1 ; 8.3 9.1另一种方法是使用具有更多属性的幻灯片窗口,例如sample、Company、Year、Feature 1等。但是你会得到一个大的神经网络模型。这不是问题,但可能需要更多的计算时间来训练它。
另一个重要的一点是,神经网络是一个数学模型,因此,像Company这样的定性属性(其中值为A或B )必须转换为数字,例如:1 (对于A),2 (对于B)等。
https://stackoverflow.com/questions/33689637
复制相似问题