首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈数据化营销

    大数据分析:全面分析18亿票房《羞羞的铁拳》传播套路

    期间,每天数据增长都是以数万计,而且移动端数据超过pc端数据,最高差距有5倍之多。 (4)声量重点信息:全网声量的重点信息聚类如下,主要还是体现出电影搞笑和高票房的内容。 ? (5)全网内容词云图:全网文章、新闻、微博、微信、贴吧等平台上主要的点还是“快乐”、“喜欢”、“支持”、“刺激”、“感动”等,几乎很少有负面信息。 ? (5)声量全国分布图: ? (4)转发热词和内容分析:可以看出大家还是很期待这部电影的,给予了支持,看来这部电影带红了艾伦,又让马丽和沈腾出名了一把。 ? (5)网友评论观点:大部分集中在对艾伦的赞扬,以及影片搞笑元素上。 总结: 1、是金子总会发光,《羞羞的铁拳》没有利用明星和大V做大幅度的宣传,但是还是依靠全网高声量的良好口碑赢得了票房

    92170发布于 2018-05-07
  • 来自专栏爬虫资料

    电影产业的数据洞察:爬虫技术在票房分析中的应用

    本文将介绍爬虫技术在票房分析中的应用,包括爬虫技术的原理、流程和工具,以及如何使用爬虫技术获取和分析电影票房数据,并给出一些实例和结论。 爬虫技术在票房分析中的应用爬虫技术在票房分析中的应用主要是通过从各大电影网站上抓取电影票房数据,然后对数据进行分析,得到一些有关电影市场的洞察。 电影票房信息:如电影的总票房、单日票房、单周票房、平均票价、排片率、上座率等,这些数据可以帮助我们了解电影的收入状况和市场表现,也可以作为后续分析的指标和结果。 爬虫技术在票房分析中的实例为了具体展示爬虫技术在票房分析中的应用,我们以豆瓣电影为目标网站,使用Python语言和Scrapy库编写爬虫代码,并使用亿牛云爬虫代理提供代理IP服务,抓取2023年上映的中国大陆电影的基本信息和票房信息 ,包括爬虫技术的原理、流程和工具,以及如何使用爬虫技术获取和分析电影票房数据,并给出了一些实例和结论。

    71620编辑于 2023-10-07
  • 来自专栏Python 知识大全

    使用Pyecharts对猫眼电影票房可视化分析

    上次做了个猫眼电影的不过瘾,又感觉票房其实是最好拿到的数据,所以就继续接着它做了。废话不多说,直接上干货! 用到的工具: python 爬虫 pyecharts 下面是效果图: ? 效果图1 ? 所以都需要先进行数据清洗,先将<0.1% 的设置成 0.1%,其实也可以都在下面删除 % 的那一步设置,但是这不是还能再多学点方法以后万一以后用到呢 df = pd .read_csv('票房1111. csv') print(df.head(2)) df.loc[df.票房占比=='<0.1%','票房占比'] ='0.1%' print(df['票房占比']) df.loc[df.排片占比=='<0.1% Selector from pyecharts.commons.utils import JsCode import requests import pandas as pd 柱状图 首先我们看下第一个柱状图分析一下 init_opts=opts.InitOpts(width="1500px", height="500px")) .add(bar1, opts.GridOpts(pos_left="5%

    1.3K11发布于 2020-02-21
  • 来自专栏GopherCoder

    专栏:013:我要你知道实时票房.

    之前使用的不多,觉得尝试使用此工具操作爬虫,目的是抓取中国票房首页的数据, 采用Xpath对数据进行解析。使用ORM技术实现自动创建数据表,并将数据存储入MySQL数据库中。

    56430发布于 2018-06-06
  • 来自专栏程序猿杂货铺

    上映4天,票房7.4亿的《海王》,用Python分析数据看大片!

    写在前面 今天我要蹭个热点,我要用Python加上一些数据分析,来证明《海王》好看。 ? 上映4天,票房7.4亿 ? 在做数据分析之前,我们需要先对数据做清洗,将数据处理到最佳 读取数据,读取数据的时候记住,需要把header=None然后增加names # 读取数据 def get_data(): df = data 数据基本情况查看 查看所有数据情况 点赞的最高数目是2783 非常高了,但是平均值才0.25 可见,猫眼上人们并不是很喜欢点赞 回复数最高的才43 可以说非常低了~ 《海王》50%以上的人给了5分 看评分 5分遥遥领先,周末的票已经买好,准备去看啦~ ?

    58020发布于 2019-09-03
  • 来自专栏数据森麟

    用Python分析一下那些吸粉无数的高票房电影

    孩子:够了,谢谢妈妈,妈妈真好 奈何烂片层出不穷,电影荒就成了常事,不如回归经典,看一看电影历史上票房排行位于前端的一些电影,票房高的电影不一定精彩,但烂片票房低则是必然 本文基于requests和BeautifulSoup 爬取了电影历史票房Top480的基本信息,在观察这份文件同时也会考虑,票房的高低和评分是否存在一定的关系呢? 在利用pandas完成对这份数据概况的分析后,自然而然就会得到答案 爬虫概况简要 豆瓣是一个静态网页,所以利用requests结合BeautifulSoup就能够爬取需要的信息,但前提是我们要登陆豆瓣, 数据分析 库与工具 在进行数据分析之前,先将必要的库导入 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns matplotlib的图形可视化python包,在matplotlib的基础上进行了高级的API封装,能够用更简洁的代码绘制出更吸引人的可视化图 工具:jupyter notebook 导入数据 数据分析第一步即将被分析

    76310发布于 2020-02-20
  • 来自专栏数据科学和人工智能

    爱数科案例 | 迪士尼电影票房可视化分析

    5. 电影名称词云图 下面进行可视化分析。首先根据movie_title列信息绘制电影名称词云图。 电影种类数据分组聚合 下面绘制电影种类与票房折线图,分析电影种类是否是影响票房的因素。首先对数据进行预处理。 将数据按电影种类进行分组,计算每个种类平均每部电影总票房,代表该类电影卖座能力。 电影种类分组票房数据按列值排序 将数据按电影票房均值升值排序,便于可视化分析。 11. 电影种类与票房折线图 使用处理后的数据绘制电影种类与票房折线图。 电影评级数据分组聚合 下面绘制电影评级与票房折线图,分析电影评级是否是影响票房的因素。首先对数据进行预处理。 将数据按电影评级进行分组,计算每种评级平均每部电影总票房,代表该级电影卖座能力。 电影评级分组票房数据按列值排序 将数据按电影票房均值升值排序,便于可视化分析。 14. 电影评级与票房折线图 使用处理后的数据绘制电影评级与票房折线图。

    2.1K10编辑于 2022-03-30
  • 来自专栏Python绿色通道

    用python分析了5000部票房,发现赚钱的电影都有这些特征~

    电影时长与电影票房及评分的关系? : 剧情摘要 runtime: 电影时长 genres: 风格列表,按|分隔,最多5种风格 production_companies: 制作公司列表,按|分隔,最多5家公司 release_date: 分析结论: 从图上可以看出,改编电影的预算略高于原创电影,但改编电影的票房收入和利润远远高于原创电影, 这可能是改编电影拥有一定的影迷基础。 问题五:电影时长与电影票房及评分的关系 电影时长与电影票房的关系: ? 电影时长与电影平均评分的关系: ? 分析结论: 从图上可以看出,电影要想获得较高的票房及良好的口碑,电影的时长应保持在90~150分钟内。 问题六:分析电影关键字 先提取电影关键字: ?

    2.2K10发布于 2020-03-27
  • 来自专栏Crossin的编程教室

    用python“科学”预测下《哪吒》票房

    而它的市场表现也很给力,上映首日即破亿,5天超10亿,目前已成为国产动画片最高票房。 于是很多人开始猜测,最终的票房会达到多少? 对于纯数据分析来说,这是个好事,让我可以做一个没有感情的杀手分析师。 相关的代码、数据、原图已上传,获取方式见文末。 这是为了后面的预测分析做准备。 40亿,《哪吒》都是铁定进入历史总票房top10的,并很有希望进top5(34亿)。 最后,一个日常小福利:抽奖送5本技术书籍。 公众号里回复关键字 抽奖,即可参与,无需任何条件。花10秒钟来试试手气呗。 奖品书单和抽奖时间见今日次条。

    88830发布于 2019-08-06
  • 来自专栏bigsai

    哪吒票房逼近30亿,从豆瓣短评简单分析人们对哪吒的态度

    目录 前言 分析 具体步骤 登录 爬取与存储 可视化分析 结语 前言 暑期档电影惨淡,但随着哪吒爆红开拓了新局面。这也是国产动画的首次爆红。在哪吒刚出,笔者以为最多10亿就算不错的了。 分析 对于这么一部爆红的动画电影。我想简单分析人们对哪吒动画电影的评价状况。那么就选择猫眼票房或者豆瓣的短评爬下来分析了。 step1:打开豆瓣主页哪吒短评的界面。 评分统计: 对于评分统计,使用数组将上面的1,2,3,4,5,五个分数段读取时候写入,根据数据画出饼状图分析即可。 从上图也可以知道,对于评分,大部分还是分布在5分和4分的,占比分别为41.2%和33.4%.而2分和1分时非常少!这足以说明这部片绝对不是烂片或者争议不是很大。一部片不可能满足所有人。 可以从词云简单分析出大家还是很满意的,充满浓浓封神色彩、动画风格、不屈的争斗、国产的激动!在票房直逼30亿的情况下!我、要去看了。

    46110发布于 2019-09-24
  • 来自专栏Python分享

    票房20亿,豆瓣7.0?Python分析电影《孤注一掷》豆瓣评论数据

    数据来源分析: 明确需求: 采集的网站是什么? https://movie.douban.com/subject/35267208/comments? 评论相关数据 抓包分析相关数据来源 通过浏览器自带开发者工具进行抓包分析 <重点> 打开开发者工具: F12 或者 鼠标右键点击检查选择network 刷新网页: 让本网页的数据内容重新加载一遍 关键字搜索 fieldnames=[ '昵称', '推荐', '时间', '地区', '有用', '评论', ]) # 写入表头 csv_writer.writeheader() 分析评论数据

    60320编辑于 2023-09-02
  • 来自专栏机器学习算法与Python学习

    用python“科学”预测下《哪吒》票房

    而它的市场表现也很给力,上映首日即破亿,5天超10亿,目前已成为国产动画片最高票房。 于是很多人开始猜测,最终的票房会达到多少? 对于纯数据分析来说,这是个好事,让我可以做一个没有感情的杀手分析师。 相关的代码、数据、原图已上传,获取方式见文末。 这是为了后面的预测分析做准备。 40亿,《哪吒》都是铁定进入历史总票房top10的,并很有希望进top5(34亿)。 504场1v1仅输1场,5v5达电竞职业水平 这 10 大基础算法,程序员必知必会!

    97320发布于 2019-08-09
  • 来自专栏华章科技

    分析11年21部漫威电影,一览导演、主演、口碑票房最佳......

    05 票房 dang~~~,到了大家总是爱比较的票房了,这里以全球总票房和中国区票房展示,如下图: ? 不管是全球还是国内,票房最高的都是复联3。国内排第二的是复联2,全球排第二的是复联1。 不管国内还是国外,这种群戏都是票房最高,毕竟人多力量大嘛 ? !!! 近几年,大家应该都知道漫威越来越重视中国区,各种宣传活动,演员见面会等。 这主要原因是咱们人多,贡献票房多,是最大票仓之一,那究竟有多大呢? ? 这两年,影迷们越来越重视口碑了,一部电影的好口碑甚至可以帮助其在票房上逆转,比如药神。那么漫威的口碑如何呢?这里以国外的IMDb和豆瓣数据为例。 ? 即将上映的复联4,估计又要破很多票房纪录吧。 复联4的上映,也意味着第三阶段的结束,第四阶段的《蜘蛛侠:英雄远征》已有雏形,也是非常令人期待啊。

    85780发布于 2019-05-07
  • 来自专栏DeepHub IMBA

    EDA和数据挖掘实战:漫威与 DC电影收视率和票房分析

    代码和分析 import pandas as pd import scipy.stats as stats import matplotlib.pyplot as plt from matplotlib.pyplot 像这样: df[df.entity == 'MARVEL'].tail(5) df[df.entity == 'DC'].tail(5) 谁拍的电影更多? IMDB 评分与票房 plt.scatter(data = marvel_movies, x = 'imdb_rating', y = 'imdb_gross') plt.scatter(data = ratings and gross') plt.xlabel('IMDb Ratings') plt.ylabel('IMDb Gross') plt.legend(['Marvel', 'DC']) 就总票房而言 在 IMDB 总票房上表现不错,但如果将它与漫威进行比较,它们少很多。

    70730发布于 2021-11-16
  • 来自专栏萝卜大杂烩

    2019电影票房大盘点

    票房预览 既然是电影大年,那么票房肯定是一路飙升了,以《哪吒》和《流浪地球》为代表的国产电影,频频刷新票房新高 ? 单日票房冠军 下面我们来看看哪部电影获得了2019年单日的票房冠军呢 ? 四巨头 在这里,我们选出了2019年最具代表性的四部电影,来着重分析下它们的更多数据,分别是《哪吒》、《复联》、《流浪地球》和《我和我的祖国》 这里还是抓取猫眼网站的相关信息,具体的抓取分析过程可以查看以前的一篇 "爬取完成") break data = get_json(res) save_to_csv(data) time.sleep(5) 年度票房走势 最后,我们来看看2019年全年的票房走势情况 ? 可以看到,春节档的当日票房还是远远高于其他时间,无论是国庆还是其他任何档期都是无法匹敌的。

    63510发布于 2020-05-22
  • 来自专栏Crossin的编程教室

    2019电影票房大盘点

    票房预览 2019 是中国电影大年,开年票房就一路飙升了,以《哪吒》和《流浪地球》为代表的国产电影,频频刷新票房新高 ? 单日票房冠军 下面我们来看看哪部电影获得了2019年单日的票房冠军呢 ? 四巨头 在这里,我们选出了2019年最具代表性的四部电影,来着重分析下它们的更多数据,分别是《哪吒》、《复联》、《流浪地球》和《我和我的祖国》。 "爬取完成") break data = get_json(res) save_to_csv(data) time.sleep(5) 年度票房走势 最后,我们来看看2019年全年的票房走势情况 ? 可以看到,春节档的当日票房还是远远高于其他时间,无论是国庆还是其他任何档期都是无法匹敌的。

    74120发布于 2020-02-21
  • 来自专栏一些有趣的Python案例

    《你好,李焕英》爆红,Python爬虫+数据分析告你票房为什么这么高?

    目录 1 影评爬取并词云分析 1.1 网站选取 1.2 爬取思路 1.3 代码总观 2 实时票房搜集 2.1 网站选择 2.2 代码编写 2.3 结果展示 3 剧组照片爬取 3.1 网站选择 3.2 电影评论的目的在于分析、鉴定和评价蕴含在银幕中的审美价值、认识价值、社会意义、镜头语等方面,达到拍摄影片的目的,解释影片中所表达的主题,既能通过分析影片的成败得失,帮助导演开阔视野,提高创作水平,以促进电影艺术的繁荣和发展 词云分析 ① 获取网页请求 该实例选择采用 库进行编码。 词云分析用到了 库和 库。 orderType=0&uuid=173d6dd20a2c8-0559692f1032d2-393e5b09-1fa400-173d6dd20a2c8&riskLevel=71&optimusCode=

    87710编辑于 2022-01-05
  • 来自专栏数据科学实战

    AkShare-另外数据-电影票房

    描述: 获取当前时刻的实时电影票房数据, 每 5 分钟更新一次数据, 实时票房包含今天未开映场次已售出的票房 限量: 当前时刻的实时票房数据 输入参数 名称 类型 必选 描述 - - - - 输出参数 20 153707.79 5 6 急先锋 166.58 4.67 21 27109.02 6 7 七号房的礼物 81.22 2.28 6 1368.64 7 8 八佰 59.04 1.66 61 308789.71 8 9 掬水月在手 32.99 0.93 5 , 每月5号更新上月票房,并补充之前两个月票房 限量: 指定日期所在月份的票房数据, 只能获取最近月份的数据 输入参数 名称 类型 必选 描述 date str Y date="20201019"; 输入具体的日期即可 占总票房比重 场均人次 国家及地区 上映日期 首周天数 0 1 鲨海逃生 灾难 2473 52 5 美国/英国 2020

    1.1K20发布于 2020-10-29
  • 来自专栏用户3288143的专栏

    【数据分析可视化】用python分析了5000部票房,发现赚钱的电影都有这些特征~

    : 剧情摘要 runtime: 电影时长 genres: 风格列表,按|分隔,最多5种风格 production_companies: 制作公司列表,按|分隔,最多5家公司 release_date: 分析结论: 从图上可以看出,改编电影的预算略高于原创电影,但改编电影的票房收入和利润远远高于原创电影, 这可能是改编电影拥有一定的影迷基础。 问题五:电影时长与电影票房及评分的关系 # 电影时长与电影票房的关系: moviesdf.plot(kind='scatter', x='runtime', y='revenue', figsize=( 8,6)) plt.title('电影时长与电影票房的关系',fontsize = 15) plt.xlabel('电影时长(分钟)',fontsize=15) plt.ylabel('电影票房(美元) 分析结论: 从图上可以看出,电影要想获得较高的票房及良好的口碑,电影的时长应保持在90~150分钟内。

    1.6K50发布于 2020-07-07
  • 来自专栏PPV课数据科学社区

    《心花路放》票房破10亿的秘密

    从国庆档领跑每日票房大盘开始,《心花路放》一路保持喜人的票房增速,早在该片以平均每天35%(首映日排片率为46.64%)以上的高排片率9天创下8亿飘红票房的时候,制片方、猫眼电影(独家网络预售平台)、麦特文化 最终超预期实现了票房增速。 “4个小时内,全国给《心花路放》排了一万六千场,当天全国的票房大盘是8000多万,我们占了总票房的30%。一般而言,电影在点映期间产生的票房平均都在几百万。”    营销公司会基于数据公司提供的市场数据分析首先做一个整体的影片人群定位。一开始,麦特在给这部片子做人群定位时就有过纠结。 而麦特拿到的数据公司分析显示:首先,宁浩导演辐射的人群中80%是以男性观众为主,覆盖的人群年龄在25—40岁之间,这批人在互联网上的关注度是有的,但互动性不够强。

    1K60发布于 2018-04-20
领券