发布于 2022-09-08 19:26:04
我同意布赖恩的回答在以下方面的观点:
所有的步骤,你执行的ie嵌入,聚类,再培训,。原则上,不要代表一个非线性的深度模型所能做的,在质量上不同的数学运算。
因此,在这个意义上,我不期望得到与使用一个训练的端到端神经网络模型完全不同的性能。
话虽如此,无论我们采用甚麽方法(我预期它们是相等的),都可能要明智地处理阶级失衡的问题。
发布于 2022-09-08 18:56:15
聚类可能并不有用,因为目标是改进监督学习度量(ROC-AUC),并且所有的数据都已经有标签。
在现有标签的基础上手工创建黑色素瘤/非黑色素瘤类别,然后构建一个端到端的深度学习系统,使用多模型的信息,这可能会更好。这将自动学习对任务最重要的特性进行加权。
https://datascience.stackexchange.com/questions/113905
复制相似问题