首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏我是思聪

    豆瓣电影数据分析

    3.3 中美两国各类型电影的均分变化 4.演员与导演分析 4.1 作品数量 4.2 导演与演员排名 5.电影票房分析 5.1 票房随着年度变化趋势 5.2 票房与评分、 图 3评分与电影数量随年份的变化趋势 图 4评分占比随年份的变化趋势 1.4 评分与时长、评论人数的关系 图 5 评分与时长、评论人数的关系: (a)评分—人数,(b)评分—时长 对照图5,可以发现 按照作品数量在(0,2], (2,5], (5,10], (10,20], (20,999]进行分组统计导演数量,可以发现,15009名导演中有79.08%只拍过1-2部作品,46220名演员中有75.93% 比如数据6所表示的演员,参演作品以电视剧为主,在其他电影中仅仅饰演配角,但却排到了第6位。 图 17 导演电影均分与评论人数分布图 图 18演员电影均分与评论人数分布图 5. 5-8分的区间内; 分析图20(b)反映了,对于评价人数而言,评价人数多的电影,票房未必高,说明网友中有很大一部分是白嫖党; 分析图20(c)可知,对于时长而言,过长或过短的电影一般都不能取得好的票房,

    4.4K30编辑于 2022-05-13
  • 来自专栏Soul Joy Hub

    移动电影售票系统案例分析

    用例图 运用StarUML/EA(Enterprise Architect ),完成不少于5个用例的用例图,并为每个用例添加用例描述. 第一步:给系统取个名称:移动电影售票系统。 系统按查询条件查询电影信息和价格信息 4. 系统显示查询到电影详细信息 5. 参与者选中某个电影 6. 系统显示该电影的详细信息 替代流程 3a. 会员查询电影 2. 会员选择预定的电影,输入预定数量 3. 系统显示会员订单列表 4. 会员输入预定数量,选择以下动作: 添加到新订单 添加到已有订单 5. 商户请求发布电影信息 2. 系统显示发布电影信息界面 3. 商户输入电影信息 4. 系统检查输入的电影信息 5. 面向对象 什么是面向对象的分析? 面向对象的分析(Object Oriented Analysis,OOA)强调的是在问题域内发现和描述对象(或概念)。

    2.4K50发布于 2019-02-13
  • 来自专栏毛利学Python

    多模型电影短评情感分析

    多模型电影短评情感分析 首先,从传统的特征提取方面对比了BOW、TF-IDF、N-Gram技术,并使用不同的机器学习算法构建了不同的子模型,然后又采用了Stacking模型融合技术对短评情感进行了进一步的探索 言归正传,下面一起来看看电影短评情感分析的结果吧! 者将从以下几个大方向构建电影短评情感分析模型: 基于Bag-Of-Words特征的文本分类模型 基于TF-IDF特征的文本分类模型 基于Stacking模型融合的情感分析 基于深度学习的短评情感分析 基于 数据集说明 data目录里面的数据,只有2万行, 本项目为电影短评情感分析项目,代码文件说明: code/preprocessing.py]: 预处理文件 code/stacking.py: stacking code/dl_sa.py: 基于深度学习的情感分析模型。

    62020编辑于 2022-12-20
  • 来自专栏毛利学Python

    TMDB电影数据分析报告

    TMDB电影数据分析报告 前言 数据分析的基本流程: 提出问题 理解数据 数据清洗 构建模型 数据可视化 形成报告 一、提出问题 本次报告的主要任务是:根据历史电影数据,分析哪种电影收益能力更好 导入数据集后,通过对数据的查看,并结合要分析的问题,筛选出以下9个要重点分析的变量: |序号|变量名|说明 |------ |1|budget|电影预算(单位:美元) |2|genres|电影风格 |3 set_xlabel('电影风格', fontsize=15) ax5.set_ylabel('平均预算', fontsize=15) ax5.set_title('不同电影风格的平均预算', fontsize =45) plt.ylim(5, 7, 0.5) #可视化所有电影的评分分布 fig, ax = plt.subplots(figsize=(8,5)) ax = sns.distplot(df['vote_average = 15) plt.xticks(np.arange(11)) plt.grid(True) plt.show() 原创电影与改编电影对比分析: #原创电影与改编电影对比分析 original_novel

    1.3K50编辑于 2022-09-22
  • 来自专栏数据万花筒

    Python大数据分析告诉你,为何电影《哪吒》5天破10亿!!

    不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做《哪吒之魔童降世》的动漫电影。大家无一例外,都说非常的好看。 2 数据的分析 爬取完数据之后,接下来便是数据的分析,上述的数据中,大概有5000多条。 3 影评分析 用Python做可视化分析的工具很多,目前比较轻量级好用的库是pyecharts,在公众号里面多次讲解过它的用法,这里就不详细重复了! 从评分分布来看,大多数评分都给了满分,占总数的86.5%,其次是4.5分,占总数的7.7%,给到3分及以下的人非常少,还不足总人数的5%,要知道众口难调,这个差评比例在电影中可以算非常低的了。 其实这部大片,算是国产动画电影里面的大制作,电影制作花了5年的时间,剧本改了60几个版本,制作的团队高达千人。

    57810发布于 2021-11-15
  • 来自专栏一英里广度一英寸深度的学习

    SparkSQL 电影评价数据分析

    approximately 3,900 movies made by 6,040 MovieLens users who joined MovieLens in 2000. 2000年,100万条电影评价数据集 ,包括3900部电影和6040个用户。 M| 73| | 4| F| 234| | 4| M| 525| | 5| M| 81| | 5| F| 31| | 6| F| 102| | 6 ; else return false; } ) 总结 本文通过电影数据集分析代码

    1.2K30发布于 2018-09-12
  • 来自专栏Python小二

    Python 分析电影《南方车站的聚会》

    《南方车站的聚会》由刁亦男执导,主要演员包括:胡歌、桂纶镁、廖凡、万茜等,该片于 2019 年 5 月 18 在戛纳电影节首映,2019 年 12 月 6 日在中国正式上映。 从图中我们可以看到目前有 13 万多人评分,达到了 7.5 分,打 4 星和 3 星的居多,并非网上一些人所说的口碑两极分化(如果两级分化,应该是打 5 星 和 1 星的居多吧?!)。 我们可以看到有 5 万多条影评,目前豆瓣对查看影评数据的限制是:未登录最多可以查看 200 条数据,登录用户最多可以查看 500 条数据,我们要做的是通过 Python 爬取豆瓣 500 条影评数据,然后进行数据分析 '人物', '没有', '不是', '一种', '个人' '如果', '之后', '出来', '开始', '就是', '电影 上面我们只使用了评论内容信息,还有时间和星级信息没有使用,最后我们可以用这两项数据分析下随着时间的变化影片星级的波动情况,以月为单位统计影片从首映(2019 年 5 月)到当前时间(2019 年 12月

    83530发布于 2020-08-18
  • 来自专栏ATYUN订阅号

    利用机器学习分析电影偏好,探究电影情感历程以优化剧本

    他们的研究重点是电影的情感历程,调查这些是否属于不同的类别,以及它们是否与电影的成功有关。 研究人员使用了包含6174部电影的数据集进行训练,每部电影都有完整的剧本,收入数据,IMDb评级和其他相关信息。 他们使用自然语言处理(NLP)算法,分析电影脚本以确定情感历程,然后利用这些结果在收入与公众接受度方面探讨电影的情感历程与其成功之间的关系。 《Icarus》:“先上升后下降”(例如,码头风云,欢乐满人间,漫长的婚约) 5.《灰姑娘》:“上升,下降,再上升”(例如,青春年少,Babe,蜘蛛侠2) 6. “在未来,我们希望创建可靠的方法来分析所有媒体中的情绪弧线,包括纪录片等非小说类作品以及YouTube上的短片等视频。一旦我们对这个工具进行了优化,我们就可以将该公司的业务商业化。”

    80810发布于 2018-07-27
  • 来自专栏JackieZheng

    Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据

      在上篇实现了电影详情和短评数据的抓取。到目前为止,已经抓了2000多部电影电视以及20000多的短评数据。   数据本身没有规律和价值,需要通过分析提炼成知识才有意义。 抱着试试玩的想法,准备做一个有关情感分析方面的统计,看看这些评论里面的小伙伴都抱着什么态度来看待自己看过的电影,怀着何种心情写下的短评。    载入训练模型,分析感兴趣的维度(比如,近义词分词,关联词分析)     Github: https://github.com/NLPchina/Word2VEC_java 获取数据   数据就用短评数据 ,2万多条,对应的大概是2000多部的电影,一部电影抓的短评数在10条左右。 alpha:0.025 Progress: 0% alpha:0.02425520272641302 Progress: 2% alpha:0.023510777182349687 Progress: 5%

    1.9K91发布于 2018-01-16
  • 来自专栏小馒头学Python

    【Python数据分析五十个小案例】电影评分分析:使用Pandas分析电影评分数据,探索评分的分布、热门电影、用户偏好

    例如,分析评分分布可以帮助我们识别评分过低或过高的电影,探索评分高的电影类型,进而为推荐系统提供优化建议。本文将通过Pandas库分析电影评分数据,帮助大家探索以下问题:电影评分的分布是怎样的? movie_titles, size=5000), 'genre': np.random.choice(genres, size=5000), 'rating': np.random.uniform(5, 电影评分分布分析各评分区间的电影数量分析我们可以根据评分区间对电影进行分类,统计各个区间的电影数量。例如,评分为1-3、4-6、7-9和10分的电影各有多少部。 [['title', 'rating', 'num_ratings']])用户偏好分析用户评分偏好分析我们可以通过电影类型(genre)来分析用户的评分偏好。 ()print("\n各评分区间的电影数量:")print(rating_distribution)# 5.

    1K00编辑于 2024-11-28
  • 来自专栏Python自动化测试

    豆瓣电影评分数据分析

    在前面对接口测试的知识体系相对来说写了很多的文章,今晚就结合部分的知识体系,把获取到的知识体系,结合pyecharts来数据进行一个简单的分析。 实现的思路是访问豆瓣最新的电影,然后使用requests库对它进行请求,获取到服务端返回的数据后,依据获取的数据,分别取出电影的名称,电影的评分,然后形成可视化的东西,这样在可视化的界面中,就可以看到最近电影哪些是比较受欢迎的并且它的评分比较高 ,对我们出去看电影来说,也是一个刚需。 ,和电影相对应的评分,见实现的源码: #! movies)) titleRates=[] for rate in rates: titleRates.append(int(float(rate))) bar=Bar('豆瓣电影评分数据分析

    1.6K20发布于 2018-12-25
  • 来自专栏醉生梦死

    java抓取豆瓣电影数据,分析电影评分,生成统计图表 ---servlet

    电影评分统计图:     JFreeChart生成图片 ? ? ?     使用jsoup获取该网站的电影数据信息,此网站动态加载数据,如果直接查看网页源代码是看不到数据的。 部分代码如下: movieServlet.java     主要的功能为:获取网站的电影数据     首先获取每一个电影分类的链接: ? statement.setString(3, movie.getRelease_date()); statement.setFloat(4, movie.getScore()); statement.setString(5, conn = JdbcUtils.getConnection(); String sql = null; String key = null; int i=0; while (i<5) } } catch (SQLException e) { e.printStackTrace(); } i++; } return mapCount; } 获取每个电影评分的电影数量

    3.1K40发布于 2018-11-05
  • 来自专栏Python绿色通道

    基于Pyqt5的简单电影搜索工具,Python让你3秒搜电影

    今天给喜欢看电影的同学推荐一款 Python 制作的搜索电影片源的工具。 git clone https://github.com/lt94/MovieHeavens.git 如果没有安装 git 的话也可以直接下载下来,或者在公众号后台回复「电影搜索」获取。 python3 movies.py 如果你的电脑没有安装过 PyQt5,会报错:ModuleNotFoundError: No module named 'PyQt5'。 ? 用 pip 命令安装下 PyQt5。 pip3 install pyqt5 ? pip3 install pyqt5 -i https://pypi.douban.com/simple/ 安装好 PyQt5 后,在运行命令 python3 movies.py 就会弹出搜索片源的界面了

    1.1K30发布于 2019-08-29
  • 来自专栏Python中文社区

    Python分析《羞羞的铁拳》电影观众评论

    專 欄 ❈ 伟楠,Python中文社区专栏作者,数据分析师,知乎专栏:数据故事会。 《夏洛特烦恼》和《驴得水》,留待后面做情感分析时的训练样本。 ——让数据分析告诉你】 另外,每天凌晨2点-6点之间的评论是最少的,毕竟夜猫子还是少数啊。 我本来是想看看一部电影的热度大概能持续多久,不过由于《羞羞的铁拳》是一部上映没多久的电影,所以用它来分析不太合适。 了解数据的情况对于下一步情感分析会起到一定的帮助,比如我们从目前得到信息可以发现,大家对这部电影的评分还是比较高的,情感普遍倾向于正面。

    1.4K70发布于 2018-02-01
  • 来自专栏机器学习养成记

    商业分析python实战(二):电影智能推荐

    这时,可以利用相关数据,研究用户兴趣偏好,分析用户的需求和行为,引导用户发现需求信息,将内容准确推荐给用户。 本例通过943名用户对1664部电影的评分数据,构建协同过滤模型,进而推荐电影供用户观看。 步骤 1、获取数据; 2、数据探索分析; 3、构建智能推荐模型; 4、评估推荐系统模型。 NO.1 获取数据 数据包含943名用户对1664部电影的打分,评分在1-5分之间,超出规定范围的算异常值。 NO.2 数据探索分析 导入的数据共有99416行,3列,第一列为用户id,第二列为电影名字,第三列为打分。 同时,为了进行每部电影的打分数据探索分析,将movie列中的电影名转换为列名,转换后,可观察每部电影的评分用户数及分数的基本分布。

    1.8K40编辑于 2023-08-31
  • 来自专栏日常学python

    Python数据可视化:2018年电影分析

    本次利用猫眼电影,实现对2018年的电影大数据进行分析。 ? / 01 / 网页分析 01 标签 ? 通过点击猫眼电影已经归类好的标签,得到网址信息。 02 索引页 ? ', '3', '0', '8', '9', '4', '1', '5', '2', '7', '6'] base_unicode_list = ['x', 'uniF561', 'uniE6E1 04 每月电影上映数量 ? 每月上映数好像没什么大差距,7月最少,难道是因为天气热? 05 每月电影票房 ? 这里就看出春节档电影的威力了,金三银四、金九银十,各行各业的规律,电影行业也不例外。 08 电影名利双收TOP10 ? 计算公式是,把某部电影的评分在所有电影评分中的排名与这部电影的票房在所有票房中的排名加起来,再除以电影总数。 09 电影叫座不叫好TOP10 ? 计算公式是,把某部电影的票房排名减去某部电影的评分排名加起来,再除以电影总数。 可能是猫眼的用户比较仁慈吧,与豆瓣相比,普遍评分都比较高。

    1.1K30发布于 2018-12-13
  • 来自专栏WflynnWeb

    H5电影电视前端界面完整代码分享

    playsinline="" x5-video-player-fullscreen="true" x-webkit-airplay="allow" x5-video-orientation image&quality=80&size=b9999_10000&sec=1586841292436&di=9031fad21f8695dbc43cfc69432fbe5f&imgtype=0&src src: 'https://img.cdn.aliyun.dcloud.net.cn/guide/uniapp/%E7%AC%AC1%E8%AE%B2%EF%BC%88uni-app%E4%BA%A7%E5% image&quality=80&size=b9999_10000&sec=1586841292436&di=20bb99d209a014cf007a861fa5fad93c&imgtype=0&src src: 'https://img.cdn.aliyun.dcloud.net.cn/guide/uniapp/%E7%AC%AC1%E8%AE%B2%EF%BC%88uni-app%E4%BA%A7%E5%

    84120编辑于 2022-10-28
  • 来自专栏宏伦工作室

    豆瓣电影数据分析和可视化

    前一段时间出于个人兴趣做了个小demo,主要内容是以豆瓣电影上提供的电影数据为例,完整地展示网络数据从获取、处理到分析、可视化这一过程。纯当练手,也为感兴趣的小伙伴提供相关的技术介绍。 数据分析 最基本的分析包括一些统计量的计算,说白了就是固定或以某一个字段分类,对另一个字段进行求和或求平均。 我的主要分析字段是电影数量和平均评分,看它们和电影分类、语言、上映国家、上映时间、时长等其他字段之间有何关联。 数据可视化 俗话说,“一图胜千言”,所以数据分析的结果以可视化网站的形式给出。 我用Flask搭建了一个简单的网站,用Echarts绘制了一些简单的图标来展示分析的结果,可视化网站地址请参见文末。 网站包含三个子菜单:统计、评分、搜索。“统计”展示了和电影数量相关的分析结果。 “评分”展示了和电影评分相关的分析结果。 ? “搜索”则提供了一个简单的基于关键词匹配的搜索功能。 ? 总结 这次开发任务主要出于个人兴趣,顺便抛砖引玉地和大家介绍一些基本的方法和技术。

    3.4K70发布于 2018-06-07
  • 来自专栏JackieZheng

    Java豆瓣电影爬虫——抓取电影详情和电影短评数据

      一直想做个这样的爬虫:定制自己的种子,爬取想要的数据,做点力所能及的小分析。正好,这段时间宝宝出生,一边陪宝宝和宝妈,一边把自己做的这个豆瓣电影爬虫的数据采集部分跑起来。 动机   采集豆瓣电影数据包括电影详情页数据和电影的短评数据。   电影详情页如下图所示   需要保存这些详情字段如导演、编剧、演员等还有图中右下方的标签。    +[\\u4e00-\\u9fa5]+. +[\\u4e00-\\u9fa5]+. Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据 Java豆瓣电影爬虫——小爬虫成长记(附源码)   程序爬取控制在豆瓣可接受范围内,不会给豆瓣服务器带来很大的压力,写此程序也是个人把玩

    2.9K90发布于 2018-01-16
  • 来自专栏Python绿色通道

    用Python分析国庆最火的电影,20万数据分析

    今年的国庆假期,电影院里最受大家瞩目的电影想必就是《我和我的祖国》了吧,这部电影无论从题材还是参演阵容来说,都非常值得大家去观看,这部电影的评价也非常的好,因此,小编决定来分析一波,看看大家对于这部电影的评价如何 得到数据后,接下来便是对于数据的分析,首先我们来看一下大家最为关心的,评分的分布情况,如下图所示。 ? 可以看出,大家对于这部电影的评分几乎全都是在5分,满分的评价。而且评分在3分以下的非常少。 接下来我们对于好评和差评的人数已经评分的男女性别进行以下分析。 如下图所示。 ? ? 上图中,由于猫眼上针对于某些用户,没有给出好评和差评的数据,所以我们爬取的数据当中只是包含了绝大部分的观影人群。 由图可以看出,差评的观影者只是针对于电影本身,或者是对于影院的一些服务不满而给出的差评,但是他们对于祖国,还是充满着浓浓的爱意。 ---- 以上就是小编为大家带来的《我和我的祖国》分析,通过分析,我们发现,大家对于这部剧是抱着非常高的爱国情怀去观看的,虽然演员有小鲜肉也有老戏骨,但是在国家面前,其他的都是微不足道的。

    74500发布于 2019-10-10
领券