首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Python分享

    分析Python招聘数据,可视化展示招聘信息详情

    明确需求 明确采集网站以及数据内容 数据: 职位信息 网址: https://we.51job.com/pc/search? 职位信息代码实现 请求数据 上面的抓包分析已经说的很清楚,所以不再赘述 这里请求我们需加上 Cookie:用户信息, 常用于检测是否登陆账号 <登陆与否都有cookie> Referer:防盗链, 告诉服务器请求链接地址 , 是从哪里跳转过来 User-Agent:用户代理, 表示浏览器基本身份信息 # 模拟浏览器 headers = { 'Cookie': 'guid=54b7a6c4c43a33111912f2b5ac6699e2 '公司性质', '公司规模', '公司领域', '标签', '职位详情页', '公司详情页', ]) csv_writer.writeheader() 数据可视化展示 .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}")) ) c.load_javascript() Python招聘城市分布

    90330编辑于 2023-09-02
  • 来自专栏好奇心Log

    招聘信息 | 微软气象团队招聘

    我们的目标是让10亿用户每天消费天气和财经信息成为一种习惯。

    2.3K30发布于 2020-12-23
  • 来自专栏自学的专栏

    招聘网站招聘信息的爬取

    目标网站:拉某招聘实现目标:爬取指定职业指定地区的岗位信息,以及薪资情况1、网页分析当我们打开网页以后,使用开发者工具,使用定位工具,查看我们所要获取的数据信息是动态加载的还是写在源码中的,我们随便选择一个职业 /span/text()')company_name = html.xpath('//*[@id="jobList"]//span/div/div[2]/text()')这样我们就能获取一页岗位的信息了 本文这样写是可以请求到数据的我们可以在代码的开头写入input函数,因为网页的链接有pn、city、kd三个参数,他们分别对应着页码信息、城市信息、职业信息,我们可以手动输入想要获取的职业或者城市,这样我们就能爬取到我们想要的数据了 ,后续会针对爬取到的信息进行数据分析。 /{city_name}招聘信息.csv','a',encoding='utf-8')as f: title_d = csv.writer(f) title_d.writerows

    98040编辑于 2023-05-10
  • 来自专栏Python分享

    招聘信息太多,哪家职位才是适合你的?Python采集招聘信息

    前言 在招聘信息上,会提及工作的职位,不过大多描述是笼统的,还需要我们去了解工作的具体内容和性质。要知道,在不同的公司,同样的职位做的事情也是不一样的,工作方法更是大相径庭。 拉勾招聘是专业的互联网求职招聘平台。致力于提供真实可靠的互联网招聘求职找工作信息。 今天我们一起使用 python 采集拉钩的 python 招聘信息,分析一下找到高薪工作需要掌握哪些技术。 解释器:Python 3.6.5 | Anaconda, Inc. 2. 编辑器:pycharm 社区版 然后信心满满的 ennn 翻车了 ? 不怕,再来!!! requests.post(url, data=data, headers=headers, cookies=get_cookie()) data = response.json() 我们的需求是获取招聘信息 CSV文件 pprint.pprint(d) with open('拉钩职位信息.csv', mode='a', encoding='utf-8') as f: values

    80110发布于 2020-09-15
  • 来自专栏idba

    招聘信息】杭州51信用卡招聘MySQL DBA

    负责数据库服务日常维护、可用性监控、容量规划、故障诊断和排除、数据迁移、扩容实施等; 2. 负责数据库不同模块、平台的架构及解决方案的制定和实施,容灾设计,解决数据库日常遇到的各类重大问题; 3. 协助解决数据库相关技术问题和技术改进; 6、参与数据库自动化管理、监控平台开发; 岗位要求: 1、本科及以上学历,计算机相关专业,有优秀的数据库理论基础; 2、至少3年以上DBA工作经验,具备大中型高并发环境

    84840发布于 2018-08-09
  • 来自专栏成套网站

    2026版基于python大数据的招聘信息推荐与可视化系统

    而企业也渴望通过数据分析,洞察人才市场的动态趋势,优化招聘策略。在此背景下,基于Python大数据的招聘信息推荐与可视化系统应运而生。 2、研究意义在海量招聘信息充斥的当下,求职者筛选合适岗位犹如大海捞针。基于Python大数据的招聘信息推荐与可视化系统能为求职者带来极大便利。 同时,可视化功能将岗位的薪资范围、发展空间、地域分布等关键信息以直观的图表展示,让求职者全面了解岗位详情,做出更科学合理的求职决策,增加获得理想工作的机会。 此外,可视化分析帮助企业直观掌握招聘效果,如各渠道的招聘转化率、不同岗位的招聘周期等,以便及时调整招聘方案,提升整体招聘效率和质量。从行业层面看,该系统的研究与应用有助于推动招聘行业的数字化转型。 同时,数据可视化技术在招聘领域的应用也日益广泛,为求职者打造出直观便捷的信息查询与决策支持环境。

    66510编辑于 2025-10-31
  • 来自专栏机器学习原理

    爬虫篇(3)——招聘网站招聘信息的爬取流程

    目的:爬取智联招聘上全国的所有职位信息 职位信息包括:职位名称、福利、待遇、薪水、工作地点、工作经验、学历要求等 流程 包括分析页面和编写代码两部分 分析页面 1.主页面由职业分类组成,找到对应 二 2.副页面由职位列表和下一页组成 ? image.png 注意/table//tbody/tr/中,通过body是浏览器自动加上的,选的时候去掉 ? re.compile("jl=\d+&") url_list = [url[:-1]+pattern.sub("jl=489&",i) for i in u_list] return url_list 2. terminal-ul clearfix']/li[1]/strong)") address = r.xpath("string(//ul[@class='terminal-ul clearfix']/li[2] Gecko) Chrome/64.0.3282.119 Safari/537.36' } #1.获取职位分类列表 url_list = main_Web(url) #2.

    1.8K100发布于 2018-04-28
  • 超越常规:用PHP抓取招聘信息

    通过分析招聘网站上的职位信息,人力资源专员可以了解市场上的人才供给情况,以及不同行业和职位的竞争状况。这样的数据分析有助于企业制定更加精准的招聘策略,从而提高招聘效率和成功率。 自动化数据采集可以使招聘人员更加专注于筛选和面试合适的候选人,而不是花费大量时间在手动收集和整理职位信息上。这不仅提高了招聘效率,还能够为公司节省宝贵资源,提升整体竞争力。 因此,通过利用PHP语言进行招聘网站数据采集并将信息存储为CSV文件格式,可以为企业提供更加全面、及时的人才市场情报,为招聘和人才管理提供有力支持,助力企业实现人才战略与业务目标的有效对接。 在本文中,我们将使用PHP搭配爬虫代理IP技术来采集51job网站的招聘信息。细节采集过程中,我们将重点关注三个主要信息:公司信息、职位信息和待遇。 结论通过使用PHP和代理IP技术,我们可以有效地采集招聘网站的数据。这种方法不仅可以帮助我们获取最新的招聘信息,还可以为数据分析和市场研究提供支持。

    61810编辑于 2024-04-09
  • 来自专栏python3

    Python3获取拉勾网招聘信息

      为了了解跟python数据分析有关行业的信息,大概地了解一下对这个行业的要求以及薪资状况,我决定从网上获取信息并进行分析。 像拉勾这种网站他们的信息一般都是通过ajax加载的,而且在输入“python数据分析”敲击回车之后跳转的页面,招聘信息不是一开始就显示出来的,通过点击页码也只是招聘信息在变化甚至连network都没多大变化 点击preview可见详细信息以json形式保存着,其中‘salary’、‘workYear’、‘education’、‘positionID’(招聘信息详情页有关的id)是我们要的。 三、获取招聘详情   上面说了positionID 是为了获取详情页,详情页里面有要的任职要求。 content = etree.HTML(response.text) detail = content.xpath('//*[@id="job_detail"]/dd[2]

    97230发布于 2020-01-16
  • 来自专栏云原生生态圈

    轻松爬取拉勾网招聘岗位信息

    ,我们就需要到某个招聘网站上不断的刷页面,看数据,但是简单的想一下,可以通过Python脚本来批量的分析招聘网站上各个岗位在不同城市的需求,高效的快捷的方便我们掌握大致的方向。 实现 如何获取数据,需要掌握基本的Python爬虫知识,requests[1]模块就可以搞定了,在爬取数据之后,将其存在Excel中,因此需要xlwt[2]模块处理,当然在诸多的Python模块中,你可以选择你喜欢的 ,大可放心,同时也是为了找工作的小伙伴们提供一下参考的方向: 注意: 脚本中获取的是通过指定的页的数量获取全国各城市的岗位信息,你可以修改FetchData方法中的referer和请求地址中城市的值,以便获取你需要的目标城市的岗位信息 /usr/bin/env python3.4 # encoding: utf-8 """ Created on 2020-06-26 @title: '爬取拉钩网站的招聘信息' @author: marionxue 参考资料 [1] Requests: https://requests.readthedocs.io/en/master/ [2] xlwt: https://xlwt.readthedocs.io/en

    94420发布于 2020-07-02
  • 来自专栏kl的专栏

    java使用Jsoup精准爬取招聘信息

    前言 最近探究搜索引擎接触到爬虫,想做点什么有意思的事情,除了前面取了点CSDN的文章外,今天来爬一爬拉勾网的职位信息 认识JSOUP  jsoup 是一款Java 的HTML解析器,可直接解析某个 从一个URL,文件或字符串中解析HTML; 2. 使用DOM或CSS选择器来查找、取出数据; 3. n): 查找哪些元素的同级索引值(它的位置在DOM树中是相对于它的父节点)小于n,比如:td:lt(3) 表示小于三列的元素 :gt(n):查找哪些元素的同级索引值大于n,比如: div p:gt(2) 表示哪些div中有包含2个以上的p元素 :eq(n): 查找哪些元素的同级索引值与n相等,比如:form input:eq(1)表示包含一个input标签的Form元素 :has(seletor): 2 String companyPresentSituation=companyTwo.get(1).text();//目前阶段 Elements companyThree

    70440编辑于 2023-11-18
  • 来自专栏Python分享

    【Python爬虫】拉钩网招聘信息数据采集

    本文要点: 爬虫的基本流程 requests模块的使用 保存csv 可视化分析展示 环境介绍 python 3.8 pycharm 2021专业版 激活码 Jupyter Notebook pycharm %2Fwww.lagou.com%2Fjobs%2Flist%5Fpython%3FlabelWords%3D%26fromSearch%3Dtrue%26suginput%3D; LGSID=20211016201225 4233e74dff0ae5bd0a3d81c6ccf756e6=1634386346; _gid=GA1.2.701447082.1634386346; X_HTTP_TOKEN=ba154973a88f2f64153683436141effc1d544fa2ed ; LGRID=20211016201232-8913a057-d37d-41c3-b094-a04cf36515a7; SEARCH_ID=ff32d1294b464305b4e0907f659ef2a7 f'------------------------正在爬取第{page}页-------------------------') time.sleep(1) 保存数据 f = open('招聘数据

    1.2K20发布于 2021-10-26
  • 来自专栏爬虫逆向案例

    011:运用Scrapy爬取腾讯招聘信息

    找到items.py文件 根据目标网页,我们来确定爬取的目标为 “职位名称”、 “职位详情连接”、 “职位类型”、 “招聘人数”、 “工作地点”、 “发布时间”。 /td[2]/text()').extract_first() item['recruit_num']= node.xpath('. /td[5]/text()').extract_first() yield item 我们已经成功提取了“腾讯招聘”网的第一页数据。下面,我们来分析网页,爬取全部招聘信息。 我们根据这个规律,便可得出爬取全部招聘信息的思路 编写管道文件,存储数据 双击“pipelines.py",进入管道文件,进行编写。 即可成功实现获取腾讯招聘信息

    94820发布于 2021-11-22
  • 来自专栏纯洁的微笑

    招聘 2 名实习生。

    招聘 2 名实习生。 团队业务持续扩张,我们要继续招人了。 公司比较小属于早期的创业团队,所以来了可能什么事情都得干,有一些事情相对还比较繁琐,但成长也是真的很快! 你会亲眼见证,如何在1-2月之内起盘一个百万的项目,我一直觉得很多人挣不到钱,是因为不知道可以这样赚钱。 本次招聘2名线下的实习生,仅限于西安地区的大四学生(因为需要和N多读者交流,事情比较繁琐女性可能更合适),需要周一到周五到公司工作。 目前招聘2个岗位主要做什么? 招聘这个岗位主要的工作内容就是社群运营、私域运营。当然了,我们是一家创业公司,每年也会尝试做很多新的项目,所以工作内容会经常性的变化。 要求是什么呢? 2、不需要你有多大能力,工作难度不会很大,但是需要比较强的执行能力。(能听话照做就行) 3、有个人运营小红书、公众号、抖音的优先。

    39020编辑于 2023-04-14
  • 来自专栏Python机器学习算法说书人

    遗传算法可视化项目(2):获取信息

    昨天讲了一下实现遗传算法可视化的概述,没看过的人或者今天才关注的人点一下历史消息,或者点这里: 遗传算法可视化项目(1):概述 今天可没时间继续讲概述了,开始实现第一步:获取信息! 看上去确实比调用百度地图API简单了好多,但获取信息终究还是离不开爬虫! 找到信息源之后就是编写爬虫代码了,首先导入开发包: ? 然后就是读取网页,代码如下: ? 接着用BeautifulSoup进行解析: ? 最后就是写正则来进行筛选: ? 写入文件之后,文件最后的空行一定要删除,到以后我会把这个文件变成一个二维数组(C语言实现)a[ROW][3](ROW表示有多少条信息,3表示一个字符串数组{地名,经度,纬度}),如果空行不删,到时候会数组越界

    82910发布于 2019-07-26
  • 来自专栏毕设源码

    计算机毕业设计-基于Python的招聘信息可视化分析系统设计与实现

    基于Python的招聘信息可视化分析系统项目背景随着互联网的普及和信息技术的发展,人才招聘逐渐从传统的报纸广告、面试等方式转向线上平台。 招聘信息的数量快速增长,企业和求职者需要更加高效地获取、分析和理解这些信息。因此,基于Python的招聘信息可视化分析系统应运而生。 基于Python的招聘信息可视化分析系统项目简介该系统通过采集、处理和分析各个招聘网站上的招聘信息,并将分析结果以直观的图表、图像和统计数据的形式展示出来。 可视化展示:分析结果通过图表(如折线图、柱状图、热力图等)和地图展示,以帮助用户更直观地了解招聘市场的情况。 基于Python的招聘信息可视化分析系统项目功能设计图片基于Python的招聘信息可视化分析系统项目截图图片图片图片图片图片图片图片图片图片

    2.4K52编辑于 2023-08-18
  • 来自专栏爱写Bug

    新手向:爬取分析拉勾网招聘信息

    爱写bug(ID:icodebugs) 作者:爱写bug 前言: 看了很多网站,只发现获取拉勾网招聘信息是只用post方式就可以得到,应当是非常简单了。推荐刚接触数据分析和爬虫的朋友试一下。 2、获取招聘数据 然后解析返回的 json 对象。 出现了,我们想要的数据 在 content -> positionResult -> result , 一共从0到14共15条信息,这对应了网站每页现实的信息数。 最后把所有 company_info 汇总在一起: result = parse_page(job_json) all_company += result # 所有公司招聘信息汇在一起 接着以CSV格式存储在本地 2、数据可视化: 由于本篇为基础篇只画两个最简单的图且不做过多渲染美化,数据可视化都是一些简单的绘图,只有一个中文显示乱码问题,其他并没有什么坑,所以不做过多描述。

    63430发布于 2019-08-01
  • 来自专栏Python与Excel之交

    爬取了某网2w条招聘信息,看看有什么工作适合你​。​

    一、前言 又到一年一度的秋招了,受疫情的影响,就业难度大大增加,今天爬取2w前程无忧的招聘信息,看看有什么工作适合你。 前程无忧网址:https://search.51job.com/ 本次爬取的信息包括广州,佛山、深圳、珠海、中山这五个城市的招聘信息。 sheet = work_book.add_sheet('招聘信息') #创建标题行 cool = ('职位名称', '公司名称', '薪资', '工作地址/经验要求/学历要求/招聘人数', '福利' , '发布时间', '详情页链接') #遍历cool,一个一个的传入招聘信息工作表的第一行 for i in range(0, 7): sheet.write(0, i, cool[i]) #抓取 2w条招聘数据 for i in range(0, 20000): sheet.write(i + 1, 0, job_name_t_data[i]) sheet.write(i + 1

    43750发布于 2021-08-05
  • 来自专栏python3

    Selenium 动态爬取51job招聘信息

    爬虫实现的功能: 输入python,选择地点:上海,北京 ---->就去爬取上海,北京2个城市python招聘信息 输入会计,选择地址:广州,深圳,杭州---->就去爬取广州,深圳,杭州3个城市会计招聘信息 最后定位需要爬取的数据 岗位名,薪水,公司名,招聘信息,福利待遇,岗位职责,任职要求,上班地点,工作地点 这些数据,总之需要什么数据,就爬什么 需要打开岗位详细的链接,比如:https://jobs.51job.com  getcity.py └── mylog.py 文件说明: getcity.py  (首先运行)获取城市编号,会生成一个city.txt文件 mylog.py     日志程序,记录爬取过程中的一些信息 __doc__)         select_city = input("输入城市信息,最多可输入5个,多个城市以逗号隔开:")         # 找到51job首页上关键字输入框          根据输入结果的不同,爬取不同的信息,利用selenium可以做到动态爬取 注意:如果遇到51job页面改版,本程序运行会报错。请根据实际情况,修改对应的爬虫规则。

    1.7K40发布于 2020-11-03
  • 来自专栏前端加油站

    Echarts统计拉勾网招聘信息(scrapy 爬取)

    今天要做的就是用图表统计一下现在各公司的薪资状况(虽然很多公司不能按照招聘上他们给的薪资来给)。 数据爬取 本次使用scrapy来做数据爬取,这是一个python的框架。 仔细查看他的network发现,他的招聘信息都是在另外的ajax请求当中,并且还是整理好的。 ? 因为本人工作1年多,所以主要关注点是3年以下及3-5年,就提前选好了,城市和工作年限。 gj=3%E5%B9%B4%E5%8F%8A%E4%BB%A5%E4%B8%8B%2C3-5%E5%B9%B4&xl=%E6%9C%AC%E7%A7%91&px=default&city=%E6%88% 也没有去测试多少合适,因为不设置也是会报错的) DOWNLOAD_DELAY = 10 基础的配置项配置完毕之后,就是写数据存储的模型了,因为我只想去简单统计一下,所以只存了薪资和工资这两个字段,想要统计更多的信息 = scrapy.Field() 经过这几项配置,运行命令 scrapy crawl lagou -o a.json 就可以得到一份a.json,里面就是成都web前端相关,工作年限为0-5年的数据信息

    93830发布于 2019-07-02
领券