首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >利用聚类结果对神经网络进行再训练

利用聚类结果对神经网络进行再训练
EN

Data Science用户
提问于 2022-08-28 11:20:41
回答 2查看 147关注 0票数 1

我正在关注和扩展以前的工作,从黑色素瘤分类这里获奖者。

数据集有9个类。比赛只对一类(黑色素瘤)感兴趣。

我已经从CNN取得了特征输出(最后一层)并进行了聚类。然后用这个来分组不同的类(留下黑色素瘤作为自己的组),然后在训练中使用这个。

我已经与其他步骤(PCA、TSNE、K-Means、Hierarchichal、LDA、QDA、NDA等)进行了聚类。并有结果。我主要是想了解为什么这种再培训方法可以提高成绩的背后的数学(和背景研究)(在未分组的班级的中华民国-澳大利亚大学)。黑色素瘤)

欢迎有任何意见/相关文件!

谢谢,

EN

回答 2

Data Science用户

回答已采纳

发布于 2022-09-08 19:26:04

我同意布赖恩的回答在以下方面的观点:

所有的步骤,你执行的ie嵌入,聚类,再培训,。原则上,不要代表一个非线性的深度模型所能做的,在质量上不同的数学运算。

因此,在这个意义上,我不期望得到与使用一个训练的端到端神经网络模型完全不同的性能。

话虽如此,无论我们采用甚麽方法(我预期它们是相等的),都可能要明智地处理阶级失衡的问题。

票数 2
EN

Data Science用户

发布于 2022-09-08 18:56:15

聚类可能并不有用,因为目标是改进监督学习度量(ROC-AUC),并且所有的数据都已经有标签。

在现有标签的基础上手工创建黑色素瘤/非黑色素瘤类别,然后构建一个端到端的深度学习系统,使用多模型的信息,这可能会更好。这将自动学习对任务最重要的特性进行加权。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/113905

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档