
Fig. 1: Biases occurring along the pipeline.

- 图片说明
◉ 沿管道发生的偏差对于人类单细胞样本的机器学习模型的特异性越来越强。
Fig. 2: Illustration of societal, clinical, cohort, single-cell sequencing, ML and result-interpretation biases relevant in ML models of human single-cell data.

- 图片说明
◉ 社会偏见源于医疗系统中的结构性不平等。◉ 临床偏见源于临床数据收集和处理中的一致性问题,这引入了变异性。◉ 队列偏见源于队列构成的偏差,包括人口统计学和临床多样性。◉ 单细胞测序偏见源于技术限制和测序方法的变异性,影响数据质量。◉ 机器学习偏见源于算法和模型参数的选择,这可能产生或放大偏见。◉ 最后,结果解释偏见源于灵活的可视化和解释工具,这些工具持续或强化偏见结论,影响下游的科学和临床见解。
[div_box]
社会偏见
临床偏倚
队列偏差
单细胞测序偏差
机器学习偏差
结果解释偏差
审视数据类别以确保全面采样
收集更大且更多样化的数据集
推进协变量测试和数据校正
促进单细胞处理的进一步努力
意向使用模型的局限性报告
实施公平性测试