我想知道模型中是否可能有多个时间序列标识符列?让我们假设我希望在产品和存储级别上创建一个预测(文档建议这应该是可能的)。
如果我选择产品作为系列标识符,我留给存储的唯一选项要么是一个协变量,要么是一个属性,而这两个选项都不适用于这个场景。
将产品连接起来并存储并使用该连接ID的单个产品和存储代码值作为属性是一个解决方案吗?感觉不对,但我看不出还有别的选择--我错过了什么吗?
注意:我知道顶点AI的这一特性目前正在预览中,因此选项可能是有限的。
发布于 2021-09-23 05:48:16
发布于 2021-10-14 22:49:56
只是为了跟进维沙尔的(正确)答案,以防有人在将来查到这件事。
是的,连接是目前唯一的选择,因为只能有一个时间序列标识符(我希望这将在将来发生变化)。尽管如此,我已经尝试将数据中的单个标识符作为分类属性添加,它实际上运行得很好。通过这种方式,我已经在产品/商店级别上进行了预测,但我可以将单个产品的所有预测汇总在一起,而且结果与经过汇总数据培训的模型没有多大关系(显然,这将取决于需求分类和所选择的优化方法以及其他因素)。
还有一个有趣的观察。当您包括产品描述之类的内容时,您可以将它们归类为分类或文本。我无法在文档中找到,如果模型只使用unigram(这是控制台中的列统计数据所建议的)或一些n克,但这肯定是您想要对数据进行实验的东西。当使用分类分类时,我的数据集实际上显示出了更高的准确性,这有点违背直觉,因为它感觉像是多余的信息,虽然很难分辨,因为文档并不是很详细。它可能是特定于我的数据集,所以,正如我说的,确保你用你的实验。
https://stackoverflow.com/questions/69269073
复制相似问题