使用AutoML (来自H2O)是否可以只使用Word2Vec算法,并尝试不同的参数值,以找出哪些参数设置为我的数据集提供了最准确的向量?因此,我不希望AutoML将DeepLearning、GBM等算法应用到我的数据集。只有Word2Vec算法…我该怎么做?
到目前为止,我只用H2O构建了一个word2vec模型。
我想用AutoML测试Word2Vec的超参数的不同设置,以评估哪些设置是最佳的……
发布于 2019-03-27 00:54:05
Word2Vec算法是一种数据转换算法(将文本行转换为矩阵),而不是一种有监督的机器学习算法(这正是AutoML及其内部的所有算法所做的)。
使用Word2Vec的典型方式是将Word2Vec应用于文本数据,以便您的数据可以用于训练有监督的ML算法。在这里,您可以对转换后的数据集运行任何监督算法(GLM、随机森林、GBM等) --或者我的建议是将转换后的数据传递给AutoML,这样它就可以为您找到最好的算法。
您将不得不手动尝试Word2Vec的不同设置,并查看它们的表现如何,给定一些特定的监督学习算法,以应用于您的问题。希望这能消除困惑。
https://stackoverflow.com/questions/55359773
复制相似问题