首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈数据化营销

    大数据分析:全面分析18亿票房《羞羞的铁拳》传播套路

    2、全网热度指数及来源分析: (1)全网声量分析:从9月25日到10月15日,微博相关声量有126万,微信相关声量只有1.2万,全网声量达到134万。 ? (2)具体声量分布:微博是《羞羞的铁拳》最主要的宣传阵地。 ? (3)各个平台友好度分析:各个平台对《羞羞的铁拳》总体平均友好度达到99%,这个片子基本上没有负面信息,也是很难得。 ? (4)声量重点信息:全网声量的重点信息聚类如下,主要还是体现出电影搞笑和高票房的内容。 ? 2、转发层级分析: 微博在传播中共形成9个转发层级,经微博反垃圾系统处理后,剩余有效转发数5617条,覆盖微博用户18,250,733人;第1层级转发者共转发5260次,占总转发数的93.64%,是微博传播的主要力量 (2)性别分析:互动者以男性为主,果然是狼多肉少的世界…… ? (3)标签分析:转发和评论者主要的兴趣标签还是明星,美食、娱乐、旅游为主,这些人都是互联网的重度用户。 ?

    92170发布于 2018-05-07
  • 来自专栏爬虫资料

    电影产业的数据洞察:爬虫技术在票房分析中的应用

    本文将介绍爬虫技术在票房分析中的应用,包括爬虫技术的原理、流程和工具,以及如何使用爬虫技术获取和分析电影票房数据,并给出一些实例和结论。 爬虫技术在票房分析中的应用爬虫技术在票房分析中的应用主要是通过从各大电影网站上抓取电影票房数据,然后对数据进行分析,得到一些有关电影市场的洞察。 电影票房信息:如电影的总票房、单日票房、单周票房、平均票价、排片率、上座率等,这些数据可以帮助我们了解电影的收入状况和市场表现,也可以作为后续分析的指标和结果。 爬虫技术在票房分析中的实例为了具体展示爬虫技术在票房分析中的应用,我们以豆瓣电影为目标网站,使用Python语言和Scrapy库编写爬虫代码,并使用亿牛云爬虫代理提供代理IP服务,抓取2023年上映的中国大陆电影的基本信息和票房信息 ,包括爬虫技术的原理、流程和工具,以及如何使用爬虫技术获取和分析电影票房数据,并给出了一些实例和结论。

    71620编辑于 2023-10-07
  • 来自专栏Python 知识大全

    使用Pyecharts对猫眼电影票房可视化分析

    效果图2 重点来了,代码部分及讲解 dict = [] url = 'http://piaofang.maoyan.com/second-box? csv') print(df.head(2)) df.loc[df.票房占比=='<0.1%','票房占比'] ='0.1%' print(df['票房占比']) df.loc[df.排片占比=='<0.1% '].str.strip("%").astype(float) p_float1 = df['排片占比'].str.strip("%").astype(float) p_float2 = df['上座率 Selector from pyecharts.commons.utils import JsCode import requests import pandas as pd 柱状图 首先我们看下第一个柱状图分析一下 opts.MarkPointItem(type_="min")]), )#配置y轴,设置轴颜色,突出点的位置,是否平滑的曲线,其他位置配置转到index=2中设置

    1.3K11发布于 2020-02-21
  • 来自专栏GopherCoder

    专栏:013:我要你知道实时票房.

    之前使用的不多,觉得尝试使用此工具操作爬虫,目的是抓取中国票房首页的数据, 采用Xpath对数据进行解析。使用ORM技术实现自动创建数据表,并将数据存储入MySQL数据库中。 创建数据表 将结构化数据存储入数据库中 技能需求: selenium 的基本使用 unittest 的基本使用 sqlalchemy的基本使用 xpath语法的掌握 MySQL数据基本知识 ---- 2. InnoDB', mysql_charset='utf8') # 表声明,定义字段及类型 sql_table.create() # 创建数据库表 sql_table_2 = Table("Realtime_film", metadata, autoload=True) i = sql_table_2.insert() # for one in Movie_datas:

    56430发布于 2018-06-06
  • 来自专栏程序猿杂货铺

    上映4天,票房7.4亿的《海王》,用Python分析数据看大片!

    写在前面 今天我要蹭个热点,我要用Python加上一些数据分析,来证明《海王》好看。 ? 上映4天,票房7.4亿 ? 在做数据分析之前,我们需要先对数据做清洗,将数据处理到最佳 读取数据,读取数据的时候记住,需要把header=None然后增加names # 读取数据 def get_data(): df = 图表的实现用的是pychats,官方文档在 http://pyecharts.org/#/zh-cn/prepare 你可以去查阅文档,看一下详细的参数设置 # 分析打分score情况 def analysis2 data_reshape = data.pivot_table(index="startTime",columns="hour",values="count") bar = Bar("分时评论分析

    58020发布于 2019-09-03
  • 来自专栏数据森麟

    用Python分析一下那些吸粉无数的高票房电影

    孩子:够了,谢谢妈妈,妈妈真好 奈何烂片层出不穷,电影荒就成了常事,不如回归经典,看一看电影历史上票房排行位于前端的一些电影,票房高的电影不一定精彩,但烂片票房低则是必然 本文基于requests和BeautifulSoup 爬取了电影历史票房Top480的基本信息,在观察这份文件同时也会考虑,票房的高低和评分是否存在一定的关系呢? 在利用pandas完成对这份数据概况的分析后,自然而然就会得到答案 爬虫概况简要 豆瓣是一个静态网页,所以利用requests结合BeautifulSoup就能够爬取需要的信息,但前提是我们要登陆豆瓣, 数据分析 库与工具 在进行数据分析之前,先将必要的库导入 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns matplotlib的图形可视化python包,在matplotlib的基础上进行了高级的API封装,能够用更简洁的代码绘制出更吸引人的可视化图 工具:jupyter notebook 导入数据 数据分析第一步即将被分析

    76310发布于 2020-02-20
  • 来自专栏数据科学和人工智能

    爱数科案例 | 迪士尼电影票房可视化分析

    数据集中包括六列数据,分别是电影名、上映时间、电影种类、电影评级、总票房和根据通货膨胀率调整后总票房,这些数据能全面的反映每一部电影的基本信息。 2. 电影种类数据分组聚合 下面绘制电影种类与票房折线图,分析电影种类是否是影响票房的因素。首先对数据进行预处理。 将数据按电影种类进行分组,计算每个种类平均每部电影总票房,代表该类电影卖座能力。 电影种类分组票房数据按列值排序 将数据按电影票房均值升值排序,便于可视化分析。 11. 电影种类与票房折线图 使用处理后的数据绘制电影种类与票房折线图。 电影评级数据分组聚合 下面绘制电影评级与票房折线图,分析电影评级是否是影响票房的因素。首先对数据进行预处理。 将数据按电影评级进行分组,计算每种评级平均每部电影总票房,代表该级电影卖座能力。 电影评级分组票房数据按列值排序 将数据按电影票房均值升值排序,便于可视化分析。 14. 电影评级与票房折线图 使用处理后的数据绘制电影评级与票房折线图。

    2.1K10编辑于 2022-03-30
  • 来自专栏Python绿色通道

    用python分析了5000部票房,发现赚钱的电影都有这些特征~

    电影时长与电影票房及评分的关系? 2、导入数据 ? 2分析Universal Pictures和Paramount Pictures两家影视公司电影发行的走势 抽取相关数据列进行处理: ? 两家影视公司电影发行的折线图: ? 分析结论: 从图上可以看出,改编电影的预算略高于原创电影,但改编电影的票房收入和利润远远高于原创电影, 这可能是改编电影拥有一定的影迷基础。 分析结论: 从图上可以看出,电影要想获得较高的票房及良好的口碑,电影的时长应保持在90~150分钟内。 问题六:分析电影关键字 先提取电影关键字: ?

    2.2K10发布于 2020-03-27
  • 来自专栏孟永辉

    《战狼2票房迫近50亿,影视众筹的爆款进击逻辑

    文|孟永辉 《战狼2》的热映再次将人们的视线拉回到互联网金融的一个重要领域——影视众筹。从某种意义上来讲,《战狼2》是由多家投资以及发行机构共同助力之下完成的。 根据有关报道显示,《战狼2》在被北京文化、聚合影联保底发行的情况下,又陆续进入几家出品方,甚至保底队伍中后来也加入了鹿鸣影业、启泰文化、启迪影业等几家公司。 类似《战狼2》引入多家投资机构的做法,其实早已屡见不鲜,《绣春刀2》、《绝世高手》还有早前的《美人鱼》都进行了同样的操作手法进行运作。 我们能够通过影视众筹的方式将用户置于某个电影的场景之中,将商品分别布置在这些场景之中,用户通过参与到这些场景当中,能够模拟电影场景当中情形,实现商品销售的电影场景化;另外,我们还能够通过收集用户参与影视众筹项目的数据来分析和了解用户对于某种类型的影视剧的偏好程度 《战狼2》的热映让我们再次见识到了影视众筹的魅力,而有关影视众筹对于传统影视投资逻辑的改造或许仅仅只是一个开始。

    68880发布于 2018-05-15
  • 来自专栏Crossin的编程教室

    用python“科学”预测下《哪吒》票房

    对于纯数据分析来说,这是个好事,让我可以做一个没有感情的杀手分析师。 相关的代码、数据、原图已上传,获取方式见文末。 (还有小彩蛋) ---- 截至发稿时(8月2日)是《哪吒》上映第8天,实时票房15亿多,前7日票房14.68亿。 一种粗糙的预测方式就是:找一找之前类似电影这个时间的票房是多少,按倍数乘一下。 这是为了后面的预测分析做准备。 比如常用来作对比的《大圣归来》,前7日票房累计为2.99亿,总票房9.56亿,按比例算一下《哪吒》票房就是近47亿;而拿《流浪地球》来作为参考,前7日票房累计为23.6亿,总票房46.55亿,结果就是28.9 因为: 都是预算紧缺情况下完成的高质量作品 上映后都有比较好的口碑传播,形成现象级话题 都有知名度较高的题材(刘慈欣/哪吒) 都在热门档期(春节/暑期) 如果在现有数据上,加上这个这周末的三天猜测数据(2亿

    88730发布于 2019-08-06
  • 来自专栏bigsai

    哪吒票房逼近30亿,从豆瓣短评简单分析人们对哪吒的态度

    分析 对于这么一部爆红的动画电影。我想简单分析人们对哪吒动画电影的评价状况。那么就选择猫眼票房或者豆瓣的短评爬下来分析了。 step1:打开豆瓣主页哪吒短评的界面。 step2:分析这个接口,发现无加密。返回的是json套html需要解析处理一下。用网页访问这个接口。但是你会发现一旦你访问页面靠后它就拒绝访问了。提示你要登录再访问。 step3:思路很清晰了。 评分统计: 对于评分统计,使用数组将上面的1,2,3,4,5,五个分数段读取时候写入,根据数据画出饼状图分析即可。 统计完的词频排序前300个词展示在2个词云上。这些词语的出现频率均大于10.所以还是有所参考价值额。 可以从词云简单分析出大家还是很满意的,充满浓浓封神色彩、动画风格、不屈的争斗、国产的激动! 在票房直逼30亿的情况下!我、要去看了。

    46110发布于 2019-09-24
  • 来自专栏Python分享

    票房20亿,豆瓣7.0?Python分析电影《孤注一掷》豆瓣评论数据

    数据来源分析: 明确需求: 采集的网站是什么? https://movie.douban.com/subject/35267208/comments? 评论相关数据 抓包分析相关数据来源 通过浏览器自带开发者工具进行抓包分析 <重点> 打开开发者工具: F12 或者 鼠标右键点击检查选择network 刷新网页: 让本网页的数据内容重新加载一遍 关键字搜索 fieldnames=[ '昵称', '推荐', '时间', '地区', '有用', '评论', ]) # 写入表头 csv_writer.writeheader() 分析评论数据 evaluate_num)] data_pair.sort(key=lambda x: x[1]) c = ( Pie(init_opts=opts.InitOpts(bg_color="#2c343c area_type, area_num)] data_pair.sort(key=lambda x: x[1]) d = ( Pie(init_opts=opts.InitOpts(bg_color="#2c343c

    60320编辑于 2023-09-02
  • 来自专栏个人路线

    全球电影票房排行榜,哪吒2位居第四

    项目概述 简介 全球电影票房排行榜是一款展示全球电影票房数据的应用,采用科技风格 UI 设计,提供直观的票房数据可视化展示。 背景和动机 随着全球电影产业的蓬勃发展,电影票房数据成为衡量电影成功与否的重要指标。 点击刷新按钮可重新获取最新数据 点击电影卡片可查看详细票房信息和数据可视化 示例代码 // 获取电影票房数据 fetchMovies() { uni.request({ url: 'nutpi 项目架构与技术栈 架构设计 前端:基于 uni-app 框架的 Vue.js 应用 数据源:实时 API + 备用离线数据 页面结构:主页(电影列表) + 详情页(电影详情) 技术选型 uni-app[2] 相关资源 uni-app 官方文档[7] Vue.js 官方文档[8] 参考资料 [1] HBuilderX: https://www.dcloud.io/hbuilderx.html [2] uni-app

    45320编辑于 2025-04-02
  • 来自专栏机器学习算法与Python学习

    用python“科学”预测下《哪吒》票房

    对于纯数据分析来说,这是个好事,让我可以做一个没有感情的杀手分析师。 相关的代码、数据、原图已上传,获取方式见文末。 (还有小彩蛋) ---- 截至发稿时(8月2日)是《哪吒》上映第8天,实时票房15亿多,前7日票房14.68亿。 一种粗糙的预测方式就是:找一找之前类似电影这个时间的票房是多少,按倍数乘一下。 这是为了后面的预测分析做准备。 比如常用来作对比的《大圣归来》,前7日票房累计为2.99亿,总票房9.56亿,按比例算一下《哪吒》票房就是近47亿;而拿《流浪地球》来作为参考,前7日票房累计为23.6亿,总票房46.55亿,结果就是28.9 因为: 都是预算紧缺情况下完成的高质量作品 上映后都有比较好的口碑传播,形成现象级话题 都有知名度较高的题材(刘慈欣/哪吒) 都在热门档期(春节/暑期) 如果在现有数据上,加上这个这周末的三天猜测数据(2亿

    97320发布于 2019-08-09
  • 来自专栏华章科技

    分析11年21部漫威电影,一览导演、主演、口碑票房最佳......

    从上图可知,漫威几乎保持着每年2-3部的节奏,除2009年以外,从未断更。这种不间断出现在大屏幕上的做法,让影迷从未忘记漫威的存在,一直保持住了影迷的注意力。 执导美队1、美队2和复联3的罗素兄弟成为执导漫威宇宙电影最多的人,其次是两部蚁人的导演佩顿、两部银护的导演滚导(古恩)和钢铁侠1和2的导演乔恩。 05 票房 dang~~~,到了大家总是爱比较的票房了,这里以全球总票房和中国区票房展示,如下图: ? 不管是全球还是国内,票房最高的都是复联3。国内排第二的是复联2,全球排第二的是复联1。 11年来,票房比例越来越高,虽然在复联2和复联3之间有所下降,但主要是复联2一下子升到了一个峰值,其次是黑豹的仅几年最低点,等看完了评分,你也能明白为啥黑豹那么低了。 BTW,小编最爱的漫威电影是银护2,最爱角色是锤哥,有和小编一样的人吗?

    85680发布于 2019-05-07
  • 来自专栏DeepHub IMBA

    EDA和数据挖掘实战:漫威与 DC电影收视率和票房分析

    代码和分析 import pandas as pd import scipy.stats as stats import matplotlib.pyplot as plt from matplotlib.pyplot 数据相关性 f,ax = plt.subplots(figsize=(14,10)) sns.heatmap(df.corr(), annot=True, fmt=".2f", ax=ax) plt.show 在 IMDB 总票房上表现不错,但如果将它与漫威进行比较,它们少很多。 漫威或DC拍电影的频率对比 fig2 = px.line(df, x='year', y='title', color='entity') fig2.show() 从上图中我们可以得出结论,2002年之后 最后本文的colab地址:https://colab.research.google.com/drive/12DPN0BFYz0Slq2J8m-ney10x8DHWG8zh?

    70730发布于 2021-11-16
  • 来自专栏萝卜大杂烩

    2019电影票房大盘点

    票房预览 既然是电影大年,那么票房肯定是一路飙升了,以《哪吒》和《流浪地球》为代表的国产电影,频频刷新票房新高 ? 四巨头 在这里,我们选出了2019年最具代表性的四部电影,来着重分析下它们的更多数据,分别是《哪吒》、《复联》、《流浪地球》和《我和我的祖国》 这里还是抓取猫眼网站的相关信息,具体的抓取分析过程可以查看以前的一篇 range(15, 1200, 15): print("开始爬取第 %s 页" % page) # url = 'http://m.maoyan.com/review/v2/ /v2/comments.json? movieId=1211270&offset={}&limit=15&type=2'.format(i) # nezha res = requests.get(url).json()

    63510发布于 2020-05-22
  • 来自专栏Crossin的编程教室

    2019电影票房大盘点

    四巨头 在这里,我们选出了2019年最具代表性的四部电影,来着重分析下它们的更多数据,分别是《哪吒》、《复联》、《流浪地球》和《我和我的祖国》。 range(15, 1200, 15): print("开始爬取第 %s 页" % page) # url = 'http://m.maoyan.com/review/v2/ movieId=343473&offset={}&limit=15&type=2'.format(i) # jack chen url = 'http://m.maoyan.com/review /v2/comments.json? movieId=1211270&offset={}&limit=15&type=2'.format(i) # nezha res = requests.get(url).json()

    74120发布于 2020-02-21
  • 来自专栏一些有趣的Python案例

    《你好,李焕英》爆红,Python爬虫+数据分析告你票房为什么这么高?

    春节档贺岁片《你好,李焕英》,于2月23日最新数据出来后,票房已经突破42亿,并且赶超其他贺岁片,成为2021的一匹黑马。 从小品演员再到导演,贾玲处女作《你好李焕英》,为何能这么火? 目录 1 影评爬取并词云分析 1.1 网站选取 1.2 爬取思路 1.3 代码总观 2 实时票房搜集 2.1 网站选择 2.2 代码编写 2.3 结果展示 3 剧组照片爬取 3.1 网站选择 3.2 电影评论的目的在于分析、鉴定和评价蕴含在银幕中的审美价值、认识价值、社会意义、镜头语等方面,达到拍摄影片的目的,解释影片中所表达的主题,既能通过分析影片的成败得失,帮助导演开阔视野,提高创作水平,以促进电影艺术的繁荣和发展 词云分析用到了 库和 库。 orderType=0&uuid=173d6dd20a2c8-0559692f1032d2-393e5b09-1fa400-173d6dd20a2c8&riskLevel=71&optimusCode=

    87710编辑于 2022-01-05
  • 来自专栏数据科学实战

    AkShare-另外数据-电影票房

    1538.52 43.15 20 249064.58 1 2 喜宝 495.20 13.89 5 6385.52 2 3 一点就到家 426.22 2 喜宝 1332 -39.0 5890 37 4 5.47 6 2 3 一点就到家 1610 -60.0 23855 38 16 18 1 2 一点就到家 2 8022 -35 23215 38 8 7.36 15 2 3 姜子牙 -1 7731 -82 -01-10 3 1 2 紫罗兰永恒花园外传:永远与自动手记人偶 剧情 2342 48 6 日本 2020-01-10 3 2 3 1 2 北京寰映合生汇店 659703.84 1731.51 26.83 10471.49 6.05 2 3 首都电影院昌平店 643233.44

    1.1K20发布于 2020-10-29
领券