搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏我是思聪
豆瓣电影数据分析
一个多月后回过头来看，这篇报告虽然写得有模有样，但和数据分析报告还是有挺大差别的，主要原因在于： a.只是针对豆瓣电影数据分析太过宽泛了，具体关键指标到底是哪些呢？； 3.比起网上能搜到的其他豆瓣电影数据分析，它更为详细，可视化效果也不错；概述本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析，首先通过编写Python网络爬虫爬取了51375条电影数据 3.2 电影类型对整体均分的影响根据类型对电影数据进行聚合，整理得到各类型电影评分的时间序列，计算它们与整体均分时间序列的相关性，可得表格4与图11，可以看到剧情，喜剧，悬疑这三种类型片与总分趋势变化相关性最强表格 4 各类型电影时间序列相关性图 11部分类型电影均分与全部均分关系 3.3 中美两国各类型电影的均分变化前面已经得知，中美两国电影占比最高，且对于均分时间序列的影响最大。电影票房分析结合电影票房网（http://58921.com/）采集到的3353条票房数据，与豆瓣数据按照电影名称进行匹配，可以得到1995-2020年在中国大陆上映的电影信息，分别分析中国内地电影的数量
4.4K30编辑于 2022-05-13
来自专栏华章科技
分析11年21部漫威电影，一览导演、主演、口碑票房最佳......
漫威电影宇宙自2008年《钢铁侠》上映以来，已经过了11年了，也算是陪着大家长大了。11年来，漫威电影宇宙已上映21部电影，大家应该各自有偏好的电影，不过今天，小编抛开个人偏好，可视化一下大众的最爱。妮妮绝对是漫威电影系列的灵魂人物，美队更称他是电影系列的教父。漫威和妮妮可以说是互相成就，当初妮妮还在和毒品作斗争，漫威也没钱请大牌。现在妮妮在电影主演名单上绝对的C位，永远是演员表的第一位。意外吧，其实电影片长基本在两个小时到两个小时半之间。目前上映的电影中，无敌浩克最短，仅有112分钟。复联3最长，近有两个半小时，号称复联2.5的美队3其次。 ? 11年来，票房比例越来越高，虽然在复联2和复联3之间有所下降，但主要是复联2一下子升到了一个峰值，其次是黑豹的仅几年最低点，等看完了评分，你也能明白为啥黑豹那么低了。而且黑豹是国内外口碑差距最大的电影。虽然黑豹在国内口碑差，但国外收获了大大小小各项提名，也得了不少奖。作为黑人主角的超级英雄电影，黑豹这样政治正确的电影，有这样奇怪的趋势，也显得不那么奇怪了。
85780发布于 2019-05-07
来自专栏Soul Joy Hub
移动电影售票系统案例分析
议题与其他 UC002：查询电影票用例名：查询电影票用例编号 UC002 参与者潜在会员，会员用例描述参与者根据电影的名称、导演、以及演员，检索出所需电影的详细信息和系统按查询条件查询电影信息和价格信息 4. 系统显示查询到电影详细信息 5. 参与者选中某个电影 6. 系统显示该电影的详细信息替代流程 3a. 商户请求发布电影信息 2. 系统显示发布电影信息界面 3. 商户输入电影信息 4. 系统检查输入的电影信息 5. 系统顺序图：引导从用例过渡到系统的功能 BCE模式顺序图：鲁棒性分析方法（边界对象控制对象实体对象） UC001：注册会员 ? UC002:查询手机 ? 面向对象什么是面向对象的分析? 面向对象的分析（Object Oriented Analysis，OOA）强调的是在问题域内发现和描述对象（或概念）。
2.4K50发布于 2019-02-13
来自专栏毛利学Python
多模型电影短评情感分析
多模型电影短评情感分析首先，从传统的特征提取方面对比了BOW、TF-IDF、N-Gram技术，并使用不同的机器学习算法构建了不同的子模型，然后又采用了Stacking模型融合技术对短评情感进行了进一步的探索言归正传，下面一起来看看电影短评情感分析的结果吧！者将从以下几个大方向构建电影短评情感分析模型：基于Bag-Of-Words特征的文本分类模型基于TF-IDF特征的文本分类模型基于Stacking模型融合的情感分析基于深度学习的短评情感分析基于数据集说明 data目录里面的数据，只有2万行，本项目为电影短评情感分析项目，代码文件说明： code/preprocessing.py]: 预处理文件 code/stacking.py: stacking code/dl_sa.py: 基于深度学习的情感分析模型。
62020编辑于 2022-12-20
来自专栏毛利学Python
TMDB电影数据分析报告
TMDB电影数据分析报告前言数据分析的基本流程：提出问题理解数据数据清洗构建模型数据可视化形成报告一、提出问题本次报告的主要任务是：根据历史电影数据，分析哪种电影收益能力更好导入数据集后，通过对数据的查看，并结合要分析的问题，筛选出以下9个要重点分析的变量： |序号|变量名|说明 |------ |1|budget|电影预算（单位：美元） |2|genres|电影风格 |3 ', fontsize=20) plt.show() 不同电影风格的受欢迎程度分析： #定义一个数据框，以电影类型为索引，以每种电影类型的受欢迎程度为值 df_gen_popu = pd.DataFrame (0,1.2e11) #次纵坐标轴标签设置为百分比显示 import matplotlib.ticker as mtick ax2 = ax1.twinx() ax2.plot(range(0,20) = 15) plt.xticks(np.arange(11)) plt.grid(True) plt.show() 原创电影与改编电影对比分析： #原创电影与改编电影对比分析 original_novel
1.3K50编辑于 2022-09-22
来自专栏一英里广度一英寸深度的学习
SparkSQL 电影评价数据分析
approximately 3,900 movies made by 6,040 MovieLens users who joined MovieLens in 2000. 2000年，100万条电影评价数据集，包括3900部电影和6040个用户。 15| 28| 116| | 14| 79| 223| | 13| 34| 108| | 12| 50| 338| | 11 ; else return false; } ) 总结本文通过电影数据集分析代码
1.2K30发布于 2018-09-12
来自专栏Python小二
Python 分析电影《南方车站的聚会》
《南方车站的聚会》由刁亦男执导，主要演员包括：胡歌、桂纶镁、廖凡、万茜等，该片于 2019 年 5 月 18 在戛纳电影节首映，2019 年 12 月 6 日在中国正式上映。我们可以看到有 5 万多条影评，目前豆瓣对查看影评数据的限制是：未登录最多可以查看 200 条数据，登录用户最多可以查看 500 条数据，我们要做的是通过 Python 爬取豆瓣 500 条影评数据，然后进行数据分析 '人物', '没有', '不是', '一种', '个人' '如果', '之后', '出来', '开始', '就是', '电影上面我们只使用了评论内容信息，还有时间和星级信息没有使用，最后我们可以用这两项数据分析下随着时间的变化影片星级的波动情况，以月为单位统计影片从首映（2019 年 5 月）到当前时间（2019 年 12月
83530发布于 2020-08-18
来自专栏ATYUN订阅号
利用机器学习分析电影偏好，探究电影情感历程以优化剧本
他们的研究重点是电影的情感历程，调查这些是否属于不同的类别，以及它们是否与电影的成功有关。研究人员使用了包含6174部电影的数据集进行训练，每部电影都有完整的剧本，收入数据，IMDb评级和其他相关信息。他们使用自然语言处理（NLP）算法，分析电影脚本以确定情感历程，然后利用这些结果在收入与公众接受度方面探讨电影的情感历程与其成功之间的关系。尽管这些电影的平均表现更好，但研究人员指出，“如果说电影业应该只制作《Man in a Hole》，那就过于简单了。精心挑选的制作预算与流派相结合，可以制作出经济上成功又能表现各种情绪弧线的电影。” “在未来，我们希望创建可靠的方法来分析所有媒体中的情绪弧线，包括纪录片等非小说类作品以及YouTube上的短片等视频。一旦我们对这个工具进行了优化，我们就可以将该公司的业务商业化。”
80810发布于 2018-07-27
来自专栏JackieZheng
Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据
　　在上篇实现了电影详情和短评数据的抓取。到目前为止，已经抓了2000多部电影电视以及20000多的短评数据。　　数据本身没有规律和价值，需要通过分析提炼成知识才有意义。抱着试试玩的想法，准备做一个有关情感分析方面的统计，看看这些评论里面的小伙伴都抱着什么态度来看待自己看过的电影，怀着何种心情写下的短评。　　载入训练模型，分析感兴趣的维度（比如，近义词分词，关联词分析）　　　　Github： https://github.com/NLPchina/Word2VEC_java 获取数据　　数据就用短评数据，2万多条，对应的大概是2000多部的电影，一部电影抓的短评数在10条左右。 0.023510777182349687 Progress: 5% alpha:0.022766202946476896 Progress: 8% alpha:0.02202244651555614 Progress: 11%
1.9K91发布于 2018-01-16
来自专栏小馒头学Python
【Python数据分析五十个小案例】电影评分分析：使用Pandas分析电影评分数据，探索评分的分布、热门电影、用户偏好
例如，分析评分分布可以帮助我们识别评分过低或过高的电影，探索评分高的电影类型，进而为推荐系统提供优化建议。本文将通过Pandas库分析电影评分数据，帮助大家探索以下问题：电影评分的分布是怎样的？电影评分分布分析各评分区间的电影数量分析我们可以根据评分区间对电影进行分类，统计各个区间的电影数量。例如，评分为1-3、4-6、7-9和10分的电影各有多少部。 (df) * 100:.2f}%")热门电影分析根据评分数筛选热门电影热门电影通常有大量的评分，我们可以通过num_ratings（评分数）来筛选这些电影。 [['title', 'rating', 'num_ratings']])用户偏好分析用户评分偏好分析我们可以通过电影类型（genre）来分析用户的评分偏好。结论通过对电影评分数据的分析，我们发现：大多数电影的评分集中在7-9分之间，少部分电影评分过高或过低。热门电影不仅需要大量的评分数，还要有较高的评分。
1K00编辑于 2024-11-28
来自专栏Python自动化测试
豆瓣电影评分数据分析
在前面对接口测试的知识体系相对来说写了很多的文章，今晚就结合部分的知识体系，把获取到的知识体系，结合pyecharts来数据进行一个简单的分析。实现的思路是访问豆瓣最新的电影，然后使用requests库对它进行请求，获取到服务端返回的数据后，依据获取的数据，分别取出电影的名称，电影的评分，然后形成可视化的东西，这样在可视化的界面中，就可以看到最近电影哪些是比较受欢迎的并且它的评分比较高，对我们出去看电影来说，也是一个刚需。，和电影相对应的评分，见实现的源码： #! movies)) titleRates=[] for rate in rates: titleRates.append(int(float(rate))) bar=Bar('豆瓣电影评分数据分析
1.6K20发布于 2018-12-25
来自专栏醉生梦死
java抓取豆瓣电影数据，分析电影评分，生成统计图表 ---servlet
最近花时间学习了一下使用Java获取网站数据的方法，自己也亲自动手实践一下；共获取3000+数据，去除重复的数据剩余2000+，使用JFreeChart根据电影评分做出几张简单的统计图。电影评分统计图： JFreeChart生成图片 ? ? ? 使用jsoup获取该网站的电影数据信息，此网站动态加载数据，如果直接查看网页源代码是看不到数据的。部分代码如下： movieServlet.java 主要的功能为：获取网站的电影数据首先获取每一个电影分类的链接： ? /** * 获取种类电影信息，保存到数据库 * @param url 某一个种类的链接地址 */ private List<Movie> getMovieInfo(String url){ } } catch (SQLException e) { e.printStackTrace(); } i++; } return mapCount; } 获取每个电影评分的电影数量
3.1K40发布于 2018-11-05
来自专栏Python中文社区
Python分析《羞羞的铁拳》电影观众评论
《夏洛特烦恼》和《驴得水》，留待后面做情感分析时的训练样本。，在11号左右开始渐渐趋稳。我本来是想看看一部电影的热度大概能持续多久，不过由于《羞羞的铁拳》是一部上映没多久的电影，所以用它来分析不太合适。年10月末持续到11月中。了解数据的情况对于下一步情感分析会起到一定的帮助，比如我们从目前得到信息可以发现，大家对这部电影的评分还是比较高的，情感普遍倾向于正面。
1.4K70发布于 2018-02-01
来自专栏机器学习养成记
商业分析python实战（二）：电影智能推荐
这时，可以利用相关数据，研究用户兴趣偏好，分析用户的需求和行为，引导用户发现需求信息，将内容准确推荐给用户。本例通过943名用户对1664部电影的评分数据，构建协同过滤模型，进而推荐电影供用户观看。步骤 1、获取数据； 2、数据探索分析； 3、构建智能推荐模型； 4、评估推荐系统模型。 NO.1 获取数据数据包含943名用户对1664部电影的打分，评分在1-5分之间，超出规定范围的算异常值。 NO.2 数据探索分析导入的数据共有99416行，3列，第一列为用户id，第二列为电影名字，第三列为打分。同时，为了进行每部电影的打分数据探索分析，将movie列中的电影名转换为列名，转换后，可观察每部电影的评分用户数及分数的基本分布。
1.8K40编辑于 2023-08-31
来自专栏Reck Zhang
Java 11 - 逃逸分析
逃逸分析定义逃逸分析是一种可以有效减少Java中同步负载和内存堆分配压力的跨函数全局数据流分析方法. 通过逃逸分析, 编译器能够分析出一个新的对象的引用范围, 从而决定是否要将这个对象分配在堆上. 逃逸分析是指分析指针动态范围的方法, 当变量或者对象在方法中被分配后, 其指针有可能被返回或者被返回引用. 那么我们把其指针被其他过程或者线程所引用的现象叫做指针(引用)的逃逸. 处理逃逸分析之后, 可以得到三种对象的逃逸状态: 全局逃逸(GlobalEscape): 一个对象的引用逃出了方法或者线程. [info ][gc] GC(10) Pause Young (G1 Evacuation Pause) 7M->1M(10M) 0.334ms [0.281s][info ][gc] GC(11
80440发布于 2021-08-11
来自专栏Java架构师必看
spring源码分析11
spring源码分析11 强烈推介IDEA2020.2破解激活，IntelliJ
39820发布于 2021-04-13
来自专栏日常学python
Python数据可视化：2018年电影分析
有态度地学习双11已经过去，双12即将来临，离2018年的结束也就2个月不到，还记得年初立下的flag吗？完成了多少？相信很多人和我一样，抱头痛哭... 本次利用猫眼电影，实现对2018年的电影大数据进行分析。 ? / 01 / 网页分析 01 标签 ? 通过点击猫眼电影已经归类好的标签，得到网址信息。 02 索引页 ? range(1, 12): maoyan_glyph = maoyanFont['glyf'][maoyan_unicode_list[i]] for j in range(11 08 电影名利双收TOP10 ? 计算公式是，把某部电影的评分在所有电影评分中的排名与这部电影的票房在所有票房中的排名加起来，再除以电影总数。 09 电影叫座不叫好TOP10 ? 计算公式是，把某部电影的票房排名减去某部电影的评分排名加起来，再除以电影总数。可能是猫眼的用户比较仁慈吧，与豆瓣相比，普遍评分都比较高。
1.1K30发布于 2018-12-13
来自专栏宏伦工作室
豆瓣电影数据分析和可视化
前一段时间出于个人兴趣做了个小demo，主要内容是以豆瓣电影上提供的电影数据为例，完整地展示网络数据从获取、处理到分析、可视化这一过程。纯当练手，也为感兴趣的小伙伴提供相关的技术介绍。数据分析最基本的分析包括一些统计量的计算，说白了就是固定或以某一个字段分类，对另一个字段进行求和或求平均。我的主要分析字段是电影数量和平均评分，看它们和电影分类、语言、上映国家、上映时间、时长等其他字段之间有何关联。数据可视化俗话说，“一图胜千言”，所以数据分析的结果以可视化网站的形式给出。我用Flask搭建了一个简单的网站，用Echarts绘制了一些简单的图标来展示分析的结果，可视化网站地址请参见文末。网站包含三个子菜单：统计、评分、搜索。“统计”展示了和电影数量相关的分析结果。 “评分”展示了和电影评分相关的分析结果。 ? “搜索”则提供了一个简单的基于关键词匹配的搜索功能。 ? 总结这次开发任务主要出于个人兴趣，顺便抛砖引玉地和大家介绍一些基本的方法和技术。
3.4K70发布于 2018-06-07
来自专栏数据科学（冷冻工厂）
ATAC-seq分析：Motifs分析（11）
切割位点分析要绘制切割位点，我们希望只考虑读取的 5' 端，并且需要调整已知的 5' 读取偏移量到实际 T5 切割位点。
87220编辑于 2023-02-27
来自专栏数据科学（冷冻工厂）
ATAC-seq分析：Motifs分析（11）
切割位点分析要绘制切割位点，我们希望只考虑读取的 5' 端，并且需要调整已知的 5' 读取偏移量到实际 T5 切割位点。
1K20编辑于 2023-01-27

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

豆瓣电影数据分析

分析11年21部漫威电影，一览导演、主演、口碑票房最佳......

移动电影售票系统案例分析

多模型电影短评情感分析

TMDB电影数据分析报告

SparkSQL 电影评价数据分析

Python 分析电影《南方车站的聚会》

利用机器学习分析电影偏好，探究电影情感历程以优化剧本

Java豆瓣电影爬虫——使用Word2Vec分析电影短评数据

【Python数据分析五十个小案例】电影评分分析：使用Pandas分析电影评分数据，探索评分的分布、热门电影、用户偏好

豆瓣电影评分数据分析

java抓取豆瓣电影数据，分析电影评分，生成统计图表 ---servlet

Python分析《羞羞的铁拳》电影观众评论

商业分析python实战（二）：电影智能推荐

Java 11 - 逃逸分析

spring源码分析11

Python数据可视化：2018年电影分析

豆瓣电影数据分析和可视化

ATAC-seq分析：Motifs分析（11）

ATAC-seq分析：Motifs分析（11）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐