搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏share ai happiness
MovieLens官网数据集解释
https://grouplens.org/datasets/movielens/ 官网数据集地址 MovieLens GroupLens Research已从MovieLens网站（http://movielens.org //grouplens.org/datasets/movielens/latest/ synthetic datases MOVIELENS 1B合成数据集 MOVIELENS 1B是一种合成数据集，从 /movielens-1b/ older datasets MovieLens 100K数据集稳定的基准数据集。 /movielens/ml-1m.zip.md5 校验和链接永久链接： https://grouplens.org/datasets/movielens/1m/ MovieLens 10M数据集 /datasets/movielens/ml-10m.zip.md5 校验和链接永久链接： https://grouplens.org/datasets/movielens/10m/ MovieLens
1.8K20编辑于 2021-12-18
来自专栏Soul Joy Hub
pyspark做movielens推荐模型特征工程
同样的，我们将使用movielens数据集，我们需要进行Sample Label、Movie Features生成以及User Features的生成、最后再split Train&Test Samples
1.1K31发布于 2021-03-20
来自专栏JavaEdge
利用 Python 分析 MovieLens 1M 数据集
1.1 数据格式 movieId, imdbId, tmdbId 1.1.1 movieId 表示这部电影在movielens上的id，可以通过链接https://movielens.org/movies https://movielens.org/home [yw42mmc93m.png] https://movielens.org/movies/1 [wrdnmn7gkg.png] 1.1.2 imdbId 摘要 ======= 该数据集（ml-latest-small）描述了电影推荐服务MovieLens（http://movielens.org）的5星评级和自由文本标记活动。 2015.MovieLens数据集：历史和背景。 ACM交互式智能系统交易（TiiS）5,4：19：1-19：19。这些电影ID与MovieLens网站上使用的电影ID一致（例如，id1对应于URL https://movielens.org/movies/1）。
5.2K11发布于 2019-07-27
来自专栏JavaEdge
利用 Python 分析 MovieLens 1M 数据集
1.1 数据格式 movieId, imdbId, tmdbId 1.1.1 movieId 表示这部电影在movielens上的id，可以通过链接https://movielens.org/movies https://movielens.org/home https://movielens.org/movies/1 1.1.2 imdbId 表示这部电影在imdb上的id，可以通过链接http 摘要 ======= 该数据集（ml-latest-small）描述了电影推荐服务[MovieLens]（http://movielens.org）的5星评级和自由文本标记活动。 2015.MovieLens数据集：历史和背景。 ACM交互式智能系统交易（TiiS）5,4：19：1-19：19。这些电影ID与MovieLens网站上使用的电影ID一致（例如，id1对应于URL https://movielens.org/movies/1）。
2.3K30编辑于 2022-11-30
来自专栏拓端tecdat
MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集
本文将以MovieLens数据集为基础，帮助客户分析MATLAB模糊C均值聚类改进的协同过滤算法在推荐系统中的应用。具体地说，在MovieLens数据集中，我们可以将每一个电影看作是一个向量，其中包括电影名称、导演、演员、类型等特征。然后使用模糊C均值聚类将这些电影聚类到不同的簇中。数据 MovieLens数据是美国Minnesota大学GroupLens项目组提供的Movielens数据集ml-100k中的u2数据。图1 MovieLens不同聚类数对应的聚类有效性函数值类似的，图1中的横坐标为聚类数，纵坐标为相应的4个聚类有效性函数值。在Movielens数据集上的实验结果表明，FCMC CF得到的MAE值要优于其他几个算法。
58200编辑于 2023-05-29
来自专栏拓端tecdat
MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集
本文将以MovieLens数据集为基础，帮助客户分析MATLAB模糊C均值聚类改进的协同过滤算法在推荐系统中的应用。具体地说，在MovieLens数据集中，我们可以将每一个电影看作是一个向量，其中包括电影名称、导演、演员、类型等特征。然后使用模糊C均值聚类将这些电影聚类到不同的簇中。数据 MovieLens数据是美国Minnesota大学GroupLens项目组提供的Movielens数据集ml-100k中的u2数据。图1 MovieLens不同聚类数对应的聚类有效性函数值 ---- 01 02 03 04 类似的，图1中的横坐标为聚类数，纵坐标为相应的4个聚类有效性函数值。在Movielens数据集上的实验结果表明，FCMC CF得到的MAE值要优于其他几个算法。
40720编辑于 2023-08-31
来自专栏深度学习之tensorflow实战篇
从零到一spark进阶之路（三） pyspark 处理movies数据集(整理ING6-20)
数据概况 MovieLens数据集是由Minnesota大学的GroupLens Research Project对电影评分网站(movielens.umn.edu)收集的，数据集包含了1997年9月19 这些数据已经被处理过了（清除了那些评分次数少于20次以及信息没有填写完整的数据） MovieLens数据集： MovieLens数据集，用户对自己看过的电影进行评分，分值为1～5。 MovieLens包括两个不同大小的库，适用于不同规模的算法．小规模的库是943个独立用户对1682部电影作的10000次评分的数据（我是用这个小规模作数据处理和分析）；通过对数据集分析，为用户预测他对其他未观看的电影的打分
1.2K30发布于 2019-01-25
来自专栏数据の美
推荐系统业界hello world
u.zip 导语笔者在当年上学刚刚接触物品推荐问题时，使用的数据集就是MovieLens，那时候的课本上，大多使用传统的协同过滤算法，基于相似用户、相似物品，来解决问题。正文 MovieLens，创建于1997年，是一个推荐系统和虚拟社区网站，其主要功能为应用协同过滤技术和用户对电影的喜好，向用户推荐电影。 MovieLens保存了用户对电影的评分，其按照用户、电影的数据量大小，提供了多个数据集，如MovieLens 100k、MovieLens 1M、MovieLens 10M等等。本文以MovieLens 100k为例，数据集在文章开头附件处u.zip。试想一下，在实际业务中，我们较难获得像MovieLens这样的高质量数据集。
86270发布于 2019-12-02
来自专栏JavaEdge
Spark机器学习实战 (十二) - 推荐系统实战
在以下示例中，我们从MovieLens数据集加载评级数据，每行包含用户，电影，评级和时间戳。数据集推荐数据集推荐代码图片 MovieLens数据集由GroupLens研究组在 University of Minnesota — 明尼苏达大学（与我们使用数据集无关）中组织的。除了评分之外，MovieLens数据还包含类似“Western”的流派信息和用户应用的标签，如“over the top”和“Arnold Schwarzenegger”。 MovieLens的数据在过去20年中已经由大学的学生以及互联网上的人们进行收集了。 MovieLens有一个网站，您可以注册，贡献自己的评分，并接收由GroupLens组实施的几个推荐者算法这里]之一的推荐内容。用户ID图片所推电影图片
4.2K40编辑于 2026-01-02
来自专栏JavaEdge
Spark机器学习实战 (十二) - 推荐系统实战
在以下示例中，我们从MovieLens数据集加载评级数据，每行包含用户，电影，评级和时间戳。数据集推荐数据集推荐代码 MovieLens数据集由GroupLens研究组在 University of Minnesota — 明尼苏达大学（与我们使用数据集无关）中组织的。除了评分之外，MovieLens数据还包含类似“Western”的流派信息和用户应用的标签，如“over the top”和“Arnold Schwarzenegger”。 MovieLens的数据在过去20年中已经由大学的学生以及互联网上的人们进行收集了。 MovieLens有一个网站，您可以注册，贡献自己的评分，并接收由GroupLens组实施的几个推荐者算法这里之一的推荐内容。
2.4K30编辑于 2022-11-30
来自专栏全栈程序员必看
Matlab以特殊分隔符写入txt（dlmwrite）
clc clear all load('E:\RSWeb\mahoyt数据集\movielens\u.data'); dlmwrite('E:\RSWeb\mahoyt数据集\movielens\newdata.txt
57420编辑于 2022-07-19
来自专栏老齐教室
初学者指南：利用SVD创建推荐系统
数据集我们肯定需要一个数据集，本文中将使用著名的Movielens数据集，可以在 http://grouplens.org/datasets/movielens/ 网页上下载 movielens100k import pandas as pd import numpy as np data = pd.read_csv('movielens100k.csv') data['userId'] = data import pandas as pd import numpy as np import scipy data = pd.read_csv('movielens100k.csv') data['userId mayukh18/reco（SVD的完整代码以及其他著名RecSys算法的实现） https://paperswithcode.com/sota/collaborative-filtering-on-movielens -100k（Movielens100k的最新结果。
87410发布于 2020-08-28
来自专栏小小挖掘机
推荐系统数据集大列表
Movielens：https://grouplens.org/datasets/movielens/ 稳定的基准数据集。 1,508 2,071 35,497--[0.5, 4.0] 1.14% 1,642 1,853--Trust Jester 59,132 140 1,761,439--Explicit 21.28% MovieLens 100K 943 1,682 100,000--[1, 5] 6.30% MovieLens 1M 6,040 3,706 1,000,209--[1, 5] 4.47% MovieLens
6K52发布于 2019-10-21
来自专栏PaddlePaddle
超火的个性化推荐你再不会就OUT啦，让飞桨手把手来教你
4.1.数据准备我们以MovieLens 百万数据集（ml-1m）为例进行介绍。数据模块为 paddle.dataset.movielens import paddle movie_info = paddle.dataset.movielens.movie_info() print user_info = paddle.dataset.movielens.user_info() print user_info.values()[0] <UserInfo id(1), gender paddle.dataset.movielens.train每次会在乱序化后提供一个大小为BATCH_SIZE的数据，乱序化的大小为缓存大小buf_size。比如，movielens.train产生的第一列的数据对应的是user_id这个特征。
61410发布于 2019-10-14
来自专栏AI派
还没准备好数据呢，为什么要着急用算法呢
MovieLens MovieLens数据集由GroupLens研究组在 University of Minnesota — 明尼苏达大学（与我们使用数据集无关）中组织的。除了评分之外，MovieLens数据还包含类似“Western”的流派信息和用户应用的标签，如“over the top”和“Arnold Schwarzenegger”。 MovieLens的数据在过去20年中已经由大学的学生以及互联网上的人们进行收集了。 MovieLens有一个网站(https://movielens.org/)，您可以注册，贡献自己的评分，并接收由GroupLens组实施的几个推荐者算法这里之一的推荐内容。像MovieLens一样，Jester评分由互联网上的用户提供。你可以在这里（http://eigentaste.berkeley.edu/）贡献你自己的评分。
1.5K60发布于 2018-07-25
来自专栏深度学习框架
TensorFlow Recommenders: Quickstart
In this tutorial, we build a simple matrix factorization model using the MovieLens 100K dataset with tensorflow_datasets as tfds import tensorflow_recommenders as tfrs Read the data # Ratings data. ratings = tfds.load('movielens /100k-ratings', split="train") # Features of all the available movies. movies = tfds.load('movielens/
54660发布于 2021-07-30
来自专栏深度学习框架
Recommending movies: retrieval
In this tutorial, we're going to build and train such a two-tower model using the Movielens dataset. Often, implicit data is more useful here, and so we are going to treat Movielens as an implicit system Loading movielens/100k_ratings yields a tf.data.Dataset object containing the ratings data and loading . ratings = tfds.load("movielens/100k-ratings", split="train") # Features of all the available movies . movies = tfds.load("movielens/100k-movies", split="train") The ratings dataset returns a dictionary
64910发布于 2021-07-28
来自专栏全栈程序员必看
python+Django+Mysql+协同过滤电影推荐系统简介
leader,star ,description,all_tags,imdb,language,time_length 评分: 附带随机生成数据的脚本，可以随机生成指定数目的用户和用户的评分 movielens 数据集 movielens 100k数据集+图片数据维度: movieId,title,genres,picture 电影数量: 37544 评分数量: 93202+ movielens数据集+ 然后返回结果基于tensorflow/文本卷积网络的推荐通过movielens所提供的用户信息: 年龄—性别—职业。这三个数据维度来刻画用户数据信息。然后构造文本卷积网络来生成模型。
2K22编辑于 2022-06-30
来自专栏用户5305560的专栏
【数据分析从入门到“入坑“系列】利用Python学习数据分析-IPython讲解
当输入看似文件路径时（即使是Python字符串），按下Tab也可以补全电脑上对应的文件信息： In [7]: datasets/movielens/<Tab> datasets/movielens/movies.dat datasets/movielens/README datasets/movielens/ratings.dat datasets/movielens/users.dat In [7]: path = 'datasets/movielens/<Tab> datasets/movielens/movies.dat datasets/movielens/README datasets /movielens/ratings.dat datasets/movielens/users.dat 结合%run，tab补全可以节省许多键盘操作。
1.4K20发布于 2021-08-11
来自专栏NebulaGraph 技术文章
有了 ETL 数据神器 dbt，表数据秒变 NebulaGraph 中的图数据
数据源这里我们会用到两个数据源 OMDB 和 MovieLens。 OMDB 是一个开放的电影数据库，将用来模拟公司内部的业务数据。我们可以获得的信息有：电影电影的分类电影中的工作人员，包括：导演、动作指导、演员、后期制作等人员信息电影封面、宣传片等电影信息 MovieLens 是一个开放的数据集，用来模拟公司内部的用户数据在本例中，我们还需要从 MovieLens 的数据集中抽取需要的知识。这里，涉及到 MovieLens 数据集，我们利用的只有：用户-->电影，这一条关系。如果我们需要让它们关联起来，需要将 MovieLens 里的 movieId 转换成为 OMDB 中的电影 id，而它们之间的关联条件则是电影的标题。 cp raw_data/ml-latest-small/movies.csv seeds/movielens_movies.csv 有了 seeds 下边的文件之后，可以用一个命令把他们导入到数仓里：
2.4K31编辑于 2023-02-09

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

MovieLens官网数据集解释

pyspark做movielens推荐模型特征工程

利用 Python 分析 MovieLens 1M 数据集

利用 Python 分析 MovieLens 1M 数据集

MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集

MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集

从零到一spark进阶之路（三） pyspark 处理movies数据集(整理ING6-20)

推荐系统业界hello world

Spark机器学习实战 (十二) - 推荐系统实战

Spark机器学习实战 (十二) - 推荐系统实战

Matlab以特殊分隔符写入txt（dlmwrite）

初学者指南：利用SVD创建推荐系统

推荐系统数据集大列表

超火的个性化推荐你再不会就OUT啦，让飞桨手把手来教你

还没准备好数据呢，为什么要着急用算法呢

TensorFlow Recommenders: Quickstart

Recommending movies: retrieval

python+Django+Mysql+协同过滤电影推荐系统简介

【数据分析从入门到“入坑“系列】利用Python学习数据分析-IPython讲解

有了 ETL 数据神器 dbt，表数据秒变 NebulaGraph 中的图数据

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐