首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何处理推荐模型中的非数字用户id

如何处理推荐模型中的非数字用户id
EN

Data Science用户
提问于 2019-11-01 19:06:32
回答 2查看 86关注 0票数 0

嗨,我正在做一个关于亚马逊电影评论的实践项目,我做了所有被问到的事情,除了建立一个模型,它将推荐给那些没有看过也没有被评级过的用户的电影。但是,当我试图训练和拆分模型时,我在分配x/功能和y/目标时遇到了问题,因为user_id不是数字的,例如'A3R5OBKS7OM2IR‘。(数据包含207个包含4.9k用户的user_id列和206个电影(电影1到电影206,与受尊敬的user_id相对应的评分)。

EN

回答 2

Data Science用户

发布于 2019-11-01 19:30:42

我不知道为什么要将用户ID作为预测变量,除非用户ID中有提供信息的特定部分。例如,前三个字母可能告诉您,用户是一个高级用户,然后您可以用它来设计一个类别。

票数 1
EN

Data Science用户

发布于 2020-11-26 16:38:58

如果要将任何非数字值赋值给数字值,则可以散列它们。

在Python中,如下所示:

代码语言:javascript
复制
user_id = "A3R5OBKS7OM2IR"

user_id_numeric = hash(user_id)
票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/62541

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档