我的问题类似于这篇文章:长曲线形是什么意思?
但问题是,我的数据不是时间序列,但我也得到了这些长的形状线在tSNE图。

我不知道这意味着什么,也不知道我怎么能摆脱它。我怀疑数据中的某种结构导致了这种情况。但是我找不到一个有用的资源来解释数据中的什么结构会导致这种情况。
我的数据是单细胞数据,每一行都是单元,每一列都是生物学标记(例如CD3、CD4),因此数据是每个细胞上的标记表达式。
发布于 2019-12-04 14:14:14
欢迎来到社区Dalide!
您的数据中有一个顺序模式。作为一个非生物信息学的人,我只是在谷歌上看到生物标记物也被广泛用于了解疾病的进展 (例如阿尔茨海默症)。我希望我的例子是对的,如果我是的话,那么你会看到那些可能表明某件事情进展的曲线,这并不令人惊讶。如果您需要更精确的答案,您最好提供更多关于数据来源的信息(如果数据是公开的,则提供到您数据的链接)。
从ML的角度来看,幸运的是,我对此有所了解,tSNE中的这些曲线是由顺序模式引起的。
乐趣:作为一个同样令人惊讶的例子,有一次我在不同的葡萄酒特征中发现了顺序模式!!(每一行都是葡萄酒,每一栏都是葡萄酒的属性,如酒精含量、密度等)
https://datascience.stackexchange.com/questions/64154
复制相似问题