我不确定这个社区是否涵盖了数据治理和政策。我正在试一试,如果我需要调整的话,请告诉我。
在调查当前雇主的所有数据并制定数据治理策略时,我能够对客户的两组不同数据进行分类:
在我的组织(数据产生者和数据收集者)是一所学校的背景下:
然而,从数据收集的一般定义来看,产生的数据似乎也属于“数据收集”一词。是否有一个普遍接受的术语来区分这两个类别?
发布于 2020-02-19 09:01:51
考虑这个问题的方法可能有很多种,但在统计界,我认为你要寻找的词是因变量。
统计学家将学生(或任何其他事物)视为一个随机过程,产生结果(因变量),给出我们可以观察到的特征(自变量)。
数据科学家倾向于将这些事物分别称为目标结果和特征。
然而,这些术语都不意味着谁拥有这些数据。从哲学上讲,因变量是由随机过程产生的(结果由给定者控制),并且在某种意义上是这个过程的一个特征。不过,从政策上看,这并没有多大分量。例如,探地雷达主要关注可用于识别人员的数据。结果变量不太可能是这样的,但它可以!
https://datascience.stackexchange.com/questions/68316
复制相似问题