当然,我的数据集由多个x,y,z组成。我将定义的第一个数据集为data_1,另一个数据集定义为data_2。现在,我想比较一下这两个数据集的输出z_1、z_2的差异。问题:如何描述data1 and data2在%中的区别?如果百分比描述不合适,我如何才能以全局的方式描述差异,以便描述不只是一个z的差异,而是数据集中的所有z?
我有一个稀疏的数据,在某些条件下,我需要计算每一行第一次和最后一次观察之间的差异:如果该行只包含NA,则差异为0。如果该行仅包含1个观测值,则差异为0。如果行元素( 2)为非NA,则差异为,则它们的差异为第一行和最后一行(尾头)之间的差异。我拥有的数据:1 NA NA NA NA NA3 1 NA NA NA 5
4