我正在寻找关于数据增强的算法和教程,但它们都属于图像增强,是否可以在其他数据集中做到这一点?我正在研究帕金森数据集(https://archive.ics.uci.edu/ml/datasets/parkinsons),我想用python创建一个数据aug的例子,这可能吗?或者我应该像mnist/fmnist一样使用smt?
发布于 2020-03-16 21:21:09
如果您可以访问实际的语音记录,您可以应用一些增强技术used in speech recognition,然后重新提取诸如基频之类的特征。但是,由于您直接处理这些特性,因此增强更加棘手。可以通过在现有样本之间进行插值或添加噪波来生成合成样本,但由于这些特征高度相关,因此您需要一种智能的方法来执行此操作(有关简单方法,请参见this paper;有关更高级的技术,请参阅this one )。如果你有一个类不平衡的问题,你可以简单地尝试过采样或欠采样。
https://stackoverflow.com/questions/60706464
复制相似问题