首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生活处处有BUG

    Python爬虫抓取猫眼电影排行榜

    实现 原参考文章已经获取不了,已重新校正 本节使用 Python 爬虫抓取猫眼电影网 TOP100 排行榜(https://maoyan.com/board/4)影片信息,包括电影名称、上映时间、主演信息 offset=10 第三页:https://maoyan.com/board/4?offset=20 ... 第n页:https://maoyan.com/board/4? offset=(n-1)*10 确定正则表达式 通过分析网页元素结构来确定正则表达式,如下所示:

    <p class="name print(name,time,star) # 主函数 def run(self): #抓取第一页数据 for offset in range(0,11,<em>10</em> except Exception as e: print("错误:",e) 输出结果: 我不是药神 2018-07-05 徐峥,周一围,王传君 肖申克的救赎 1994-09-10

    47220编辑于 2023-08-07
  • 来自专栏全栈数据化营销

    用python采集猫眼电影排行榜信息

    如下图,我们需要采集先后排名、电影名称、主演、上映时间、评分5个信息,而且这些排名是分布在1-10页之间,每页总共10条信息,这就需要做翻页处理。 ? 下面就以采集猫眼电影前100榜单排名信息为例。 以上采集的只是一个页面,但是这里有10页信息需要采集,因此需要对url路径做设置,当在采集时自动翻页 全文代码: ?

    75270发布于 2018-05-07
  • 来自专栏Python爬虫逆向教程

    Python爬虫实战:抓取猫眼电影排行榜top100

    抓取猫眼电影排行 本节中,我们利用 requests 库和正则表达式来抓取猫眼电影 TOP100 的相关内容。 本节目标 本节中,我们要提取出猫眼电影 TOP100 的电影名称、时间、评分、图片等信息,提取的站点 URL 为 猫眼验证中心,提取的结果会以文件形式保存下来。 2. 抓取分析 我们需要抓取的目标站点为 猫眼验证中心,打开之后便可以查看到榜单信息,如图所示。 可以发现页面的 URL 变成 TOP100榜 - 猫眼电影 - 一网打尽好电影,比之前的 URL 多了一个参数,那就是 offset=10,而目前显示的结果是排行 11~20 名的电影,初步推断这是一个偏移量的参数 ): main(offset=i * 10) time.sleep(1) 现在猫眼多了反爬虫,如果速度过快,则会无响应,所以这里又增加了一个延时等待。

    91410编辑于 2024-02-05
  • 来自专栏域名资讯

    猫眼域名曾变身 融资10亿元

    近日,腾讯10亿元人民币融资猫眼,新估值超200亿元。其官网域名系双拼maoyan.com。 [图片]   今年9月,猫眼、微影时代合并案落定,之后共同组建新公司“猫眼微影”。 新公司将以猫眼为主体合作双方相关业务,猫眼将注入全部业务,微影时代将电影票务、演出业务及相关资产合并注入新公司。 猫眼一开始使用的域名为maoyan.meituan.com,maoyan.com是美团在2013年收购并启用的,相较于原二级域名,maoyan.com所体现出来的优势很是直观明了。 不仅显得简短好记,输入也更为方便,而且直接对应“猫眼”二字拼音,在宣传和提升流量方面益处多多,是为猫眼量身打造。    另外,通过查询可知,猫眼的手里除了maoyan.com外,并无其它品牌双拼域名。   

    77600发布于 2017-12-06
  • 来自专栏编程教程

    基础爬虫实战:抓取猫眼电影票房排行榜全流程解析

    ​基础爬虫实战:抓取猫眼电影票房排行榜全流程解析在互联网数据采集领域,爬虫技术是获取公开信息的核心工具。 本文以猫眼电影票房排行榜为例,通过Python实现一个基础爬虫项目,详细讲解从环境搭建到数据存储的全流程。整个过程无需复杂框架,适合初学者快速上手。 # -1表示全国数据 } try: response = requests.get(url, headers=headers, params=params, timeout=10 filename}") # 绘制票房TOP5柱状图 if len(df) >= 5: top5 = df.head(5) plt.figure(figsize=(10 A:可能原因:接口参数错误(如城市等级)数据未实时更新(猫眼票房数据约每日10点更新)字段解析错误(检查JSON结构是否变化)建议通过Chrome开发者工具对比Network请求参数与返回数据。

    86510编辑于 2025-10-22
  • 来自专栏牛客网

    猫眼面经

    spring的AOP和IOC  7. mysql引擎  8. mysql特性、隔离级别、mysql默认的隔离级别  9. java的集合类,vector、arraylist、linkedlist的区别  10猫眼了解多少  5. 对于猫眼感觉有什么需要优化的  6. 自己实习期间的日常生活  7. 能来实习吗  8. 有什么问题要问  4. HR面  1. 为什么选这个专业  2. 为什么读研  3. 有什么要问的  猫眼四个面试官给人的感觉都很好,面试前给倒水,问是否需要去趟卫生间(可能看我紧张),问问题都是引导着问,而且都是给一个很大的问题,自己知道多少说多少,然后再根据回答问问题。

    93510发布于 2018-09-20
  • 来自专栏汇智网教程

    以太坊10大DApp排行榜

    这是DappRadar根据其对以太坊交易的监测而自动生成的2018年2月以太坊DApp活跃度排行榜,计算的主要依据是DApp在一周内的交易量: 如果你开始对以太坊DApp的开发产生兴趣,可以访问汇智网提供的出色的在线互动教程 Etheroll 地址:https://dappradar.com/app/10/etheroll 可能是最受欢迎的去中心化赌场。 10. 原文:10 Most Active Ethereum DApps for entertainment

    2.7K70发布于 2018-05-17
  • 来自专栏老九学堂

    TIOBE 10月编程语言排行榜

    10月编程语言排行榜 TOP20 榜单 ? Top 10编程语言TIOBE指数走势(2002-2016) ? 其它榜单 第20-50名如下,可能存在遗漏的情况: ?

    98160发布于 2018-03-06
  • 来自专栏我爱编程

    猫眼Top100

    strip()[5:], 'score':item[5]+item[6] } def write_to_file(content): with open('猫眼 write_to_file(item) if __name__ == '__main__': #pool = Pool() # 使用多线程 但是会打乱顺序 #pool.map(main, [i*10 for i in range(10)]) for i in range(10): main(i*10)

    61840发布于 2018-06-13
  • 来自专栏武培轩的专栏

    猫眼面经汇总

    currenthashmap如何解决线程安全,1.7版本以及1.8版本的不同 ConcurrentHashMap源码解析(JDK1.8) arraylist默认大小,如何扩展的 ArrayList默认大小为10

    1.2K30发布于 2018-09-28
  • 来自专栏Hi, Python

    抓取猫眼电影排行

    本文链接:https://blog.csdn.net/weixin_40313634/article/details/89502198 抓取猫眼电影排行 环境 技术:requests 爬取网页 + for i in range(10): main(offset = i*10 ) 注意事项 1. 文件名不能和module名一样:负责会导致module里的方法找不到 2.

    1.3K40发布于 2019-09-29
  • 来自专栏码农编程进阶笔记

    PHP 跌出 TIOBE 编程排行榜 Top 10

    TIOBE 公布了 2021 年 11 月的编程语言排行榜。 自 20 多年前 TIOBE 指数开始发布以来,PHP 一直常驻在榜单前十;然而最近,该语言已经开始在前十的边缘苦苦挣扎。 其他语言变化不大,Assembly language 再次由第十位上升到了第八位,SQL 和 PHP 分别被挤至第 9、10 位。 TOP 10 编程语言 TIOBE 指数走势(2002-2020) 第 21-50 名编程语言排行 第 51-100 名如下,由于它们之间的数值差异较小,仅以文本形式列出(按字母排序): ABC,

    64110发布于 2021-11-19
  • 来自专栏鲸鱼动画

    猫眼三勾玉

    width:60px; height:60px; background:#000; position:absolute; top:50%; left:50%; z-index:10 margin-top:-30px; border-radius:60%; } .basic:before{ content:""; display:block; width:10px ); -webkit-transform:rotate(10deg); -o-transform:rotate(10deg); } .hook .bar:nth-child(2){ transform ; left:2px; transform:rotate(-10deg); } .tube .bar:nth-child(2){ bottom:0px; right:-10px; ; -webkit-animation:ani-shadow 1s forwards 10s; -o-animation:ani-shadow 1s forwards 10s; } @keyframes

    69630发布于 2020-09-22
  • 来自专栏杂七杂八

    正则爬取猫眼电影

    这篇文章主要是利用requests来抓取猫眼电源Top100榜单 主要内容 requests设置headers,防止反爬 爬取内容 结果json保存 多线程抓取 设置headers 设置headers , ensure_ascii=False) + '\n') 多线程抓取 from multiprocessing import Pool pool = Pool() pool.map(main,[i*10 for i in range(10)]) 全部代码 import re import os import json import requests from multiprocessing import 03d' % int(item['index']) + item['title'] + '.jpg') if __name__ == '__main__': # for i in range(10 ): # main(i+10) pool = Pool() pool.map(main,[i*10 for i in range(10)])

    62520发布于 2018-08-30
  • 来自专栏Java后端技术栈cwnait

    猫眼 面经和答案

    10. java的基本数据类型 Java的基本数据类型包括以下几种: 整数类型:byte、short、int、long 浮点数类型:float、double 字符类型:char 布尔类型:boolean

    51110编辑于 2023-09-24
  • 来自专栏python进阶学习

    【python】使用代理IP爬取猫眼电影专业评分数据

    movie_names, ‘专业评分’: professional_scores} df = pd.DataFrame(data) 6、数据可视化 数据可视化 plt.figure(figsize=(10 , 6)) plt.bar(df[‘电影名称’], df[‘专业评分’], color=‘skyblue’) plt.title(‘猫眼电影专业评分排行榜’) plt.xlabel(‘电影名称’) 电影名称’: movie_names, ‘专业评分’: professional_scores} df = pd.DataFrame(data) 数据可视化 plt.figure(figsize=(10 , 6)) plt.bar(df[‘电影名称’], df[‘专业评分’], color=‘skyblue’) plt.title(‘猫眼电影专业评分排行榜’) plt.xlabel(‘电影名称’) 为了更直观地展示数据,文章还利用pandas库将提取的数据转换成了DataFrame格式,并使用matplotlib库绘制了专业评分排行榜的条形图。

    50010编辑于 2024-06-08
  • Python爬取猫眼电影专业评分数据中的应用案例

    猫眼电影作为中国领先的电影信息与票务平台,其专业评分对于电影行业和影迷的数据来说具有重要意义。通过Python爬虫技术,我们可以实现从猫眼电影网站上自动获取这些数据目标。 通过编写爬虫程序,我们可以模拟浏览器行为,访问猫眼电影网站并提取所需的专业评分数据,为后续的数据分析和可视化提供支持。 为了实现自动获取猫眼电影专业评分数据的目标,我们需要编写一个高效的Python爬虫程序。 {'电影名称': movie_names, '专业评分': professional_scores}df = pd.DataFrame(data)# 数据可视化plt.figure(figsize=(10 , 6))plt.bar(df['电影名称'], df['专业评分'], color='skyblue')plt.title('猫眼电影专业评分排行榜')plt.xlabel('电影名称')plt.ylabel

    52710编辑于 2024-01-25
  • 来自专栏Java帮帮-微信公众号-技术文章全总结

    《最受欢迎的女友职业排行榜Top10

    上一期:《最受欢迎的男友职业排行榜Top10》 正文

    56330发布于 2020-11-02
  • 来自专栏python学习教程

    Python项目实战-爬取猫眼电影

    爬取《悲伤逆流成河》猫眼信息 项目源码分享: import requests from fake_useragent import UserAgent import json import pymongo _v_=yes' } #猫眼电影短评接口 #因为猫眼的数据是AJAX类型的 里面的offset是改变的 第一次是0 第二次15 第三次是30 以此类推 这个page 相当于100 /15然后循环 #可以自信观察猫眼AJAX数据请求参数 就会知道了 page=100 u=0 for i in range(page): try: offset=u startTime = '2018-10-11' comment_api = 'http://m.maoyan.com/mmdb/comments

    92020发布于 2019-09-03
  • 来自专栏编程微刊

    2017年10大主流编程语言最新排行榜出炉

    2017-12-25  祈澈姑娘 前言 据美国科技公司Gizmodo报道,截至2014年9月24日,全世界采用IT操作系统的设备数量已经达到10亿台,IT推动中国移动互联网进入高速发展期,成为所有行业中发展前景最好的朝阳行业 www.businessinsider.com/the-9-most-popular-programming-languages-according-to-the-facebook-for-programmers-2017-10

    1.2K30发布于 2018-06-01
领券