嗨,我正在做一个关于亚马逊电影评论的实践项目,我做了所有被问到的事情,除了建立一个模型,它将推荐给那些没有看过也没有被评级过的用户的电影。但是,当我试图训练和拆分模型时,我在分配x/功能和y/目标时遇到了问题,因为user_id不是数字的,例如'A3R5OBKS7OM2IR‘。(数据包含207个包含4.9k用户的user_id列和206个电影(电影1到电影206,与受尊敬的user_id相对应的评分)。
发布于 2019-11-01 19:30:42
我不知道为什么要将用户ID作为预测变量,除非用户ID中有提供信息的特定部分。例如,前三个字母可能告诉您,用户是一个高级用户,然后您可以用它来设计一个类别。
发布于 2020-11-26 16:38:58
如果要将任何非数字值赋值给数字值,则可以散列它们。
在Python中,如下所示:
user_id = "A3R5OBKS7OM2IR"
user_id_numeric = hash(user_id)https://datascience.stackexchange.com/questions/62541
复制相似问题