我有一个时间序列数据集,包含7个分类特征(姓名),每个数据集都有3个-5个数字特征(每个人的活动结果),按个月计算。是否可以根据选定名称的值创建预测"Y“的模型。例如:约翰+杰克= Y?2017年-02-01年。
数据集示例:

发布于 2017-10-09 16:07:06
是的你当然可以。你必须把你所有的分类变量转换成一个数字。这意味着,您的Name和Name2列中的名称可以使用单热编码器转换。
在转换它们之后,您可能会考虑一些基于场景的特性工程技术来降低维度。
在此之后,您可以使用您心中的任何模型来解决您的问题。另外,请在这个帖子到达高峰。
https://datascience.stackexchange.com/questions/23639
复制相似问题