首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏用户6838338的专栏

    Python 口碑分爬虫

    Python 口碑分爬虫 需求 全系车型分(口碑)页面中的详细系评分数据 [请添加图片描述] 操作环境 win10 Google nexus5x(root) Python3.9 Charles 好像数据是通过这个js加载出来的,打开看了一下数据相当混乱,暂且先放一边,先从APP分析一波看能否直接拿到数据接口 PS:手机环境、抓包环境的配置在这不在赘述,有兴趣的可参考之前的文章 APP抓包环境配置 下载 APP,并安装至手机 [请添加图片描述] 手机开启Postern,pc打开charles 至此抓包工作准备完成,打开APP,随便找个车型进入分页面 [请添加图片描述] 拿到加载的数据包,和web id,修改此参数即可 获取全部系id 获取系id就很简单了,先拿到品牌id然后根据品牌id请求系信息,注意这是一个post接口 def get_series(self, brand_id): series_id, city): """ 获取系口碑分 series_id: 系id """ response = self.

    1.2K40编辑于 2022-04-03
  • 来自专栏用户6838338的专栏

    Python 综合口碑数据

    Python 综合口碑数据 需求 全系车型综合口碑 优点 缺点 统计数据 [在这里插入图片描述] 操作环境 win10 Google nexus5x(root) Python3.9 Charles PS:手机环境、抓包环境的配置在这不在赘述,有兴趣的可参考之前的文章 APP抓包环境配置 下载APP,并安装至手机 [请添加图片描述] 手机开启Postern,pc打开charles 至此抓包工作准备完成 ,打开APP,随便找个车型进入分页面 [在这里插入图片描述] 还是老套路先根据页面关键词搜索一波 [在这里插入图片描述] 明显看出来后两条数据不是需要的,前四条是同一个接口返回的,应该就是需要的数据 id,修改此参数即可 获取全部系id 获取系id就很简单了,先拿到品牌id然后根据品牌id请求系信息,注意这是一个post接口 def get_series(self, brand_id): [请添加图片描述] 获取系综合口碑评分 def get_score(self, series_id): """ 获取系综合评分 series_id

    78120编辑于 2022-04-04
  • 来自专栏全栈程序员必看

    idea 添加Tomcat_怎么添加

    使用 IDEA 编辑器开发项目十分便捷,这里介绍使用 IDEA 编辑器添加 Tomcat

    1.1K40编辑于 2022-11-02
  • 来自专栏刘旷专栏

    产业寒冬背后:汽车之家、易车网、的相爱相杀

    汽车之家的车型对比服务、易车网的报价服务、的智能识别汽车等也都用到了大数据。 汽车之家的两大劲敌:易车网、 不知不觉中,互联网汽车平台格局发生了变化,原本汽车之家、易车网双雄争霸的格局,加入了,而后形成了三足鼎立的局面。 诞生于2017年的来势汹汹,上线不到两个月的时间,用户活跃度、用户使用时长就超过了易车网,紧逼汽车之家。 在流量和内容方面,依托母公司今日头条、抖音等产品的流量支持,比汽车之家更不缺流量。 在数字化、智能化技术方面,背靠互联网巨头字节跳动,汽车之家的后面则是和互联网行业相交甚少的平安集团,携带技术基因具有先天优势。 而今,凭借字节跳动技术支持,持续技术层面加码。 利用字节跳动完善的推荐技术和大数据优势,深入分析用户需求,还增加智能识、智能选等功能,大大优化了用户选择体验,弃汽车之家择的用户也越来越多。

    85620发布于 2020-02-28
  • Python爬取汽车之家评论并做竞品分析

    和汽车之家作为国内领先的汽车垂直平台,积累了大量的用户评价数据。通过Python爬虫技术抓取这些评论,并进行竞品分析,可以帮助企、市场研究人员或数据分析师优化产品策略。 本文将介绍如何:使用Python爬取/汽车之家评论(涉及Requests、Selenium、反爬策略)数据清洗与存储(Pandas、MySQL/MongoDB)竞品分析(词频统计、情感分析、可视化 爬取/汽车之家评论2.1 目标分析:动态加载(Ajax/API),需分析接口汽车之家:部分静态HTML,部分动态加载,可能需要Selenium2.2 爬取汽车之家评论(静态+动态结合)方法1 (text): return SnowNLP(text).sentimentsdf["sentiment"] = df["comment"].apply(get_sentiment)# 按来源( 结论 vs 汽车之家评论差异:汽车之家评论更偏向技术讨论,更偏向用户体验情感分析显示,某车型在的评分略高竞品优化建议:针对负面评论优化产品(如“油耗高”、“内饰一般”)结合词云分析用户关注点

    80910编辑于 2025-08-04
  • 来自专栏数控编程社区

    凯恩数控G代码详解

    单位:牙/英寸 范围:0.060-254000.000 一般加工一根螺纹时,从粗到精,用同一轨迹要进行多次螺纹切削。 因为螺纹切削开始是从检测出主轴上的位置编辑器一转信号后才开始的,因此即使进行多次螺纹切削,零件圆周上的切削点仍是相同的,工件上的螺纹轨迹也是相同的,但是从粗到精,主轴的转速必须是一定的。 : …… G00 U-62.0; G32 W-74.5 F4.0; G00 U62; W74.5; U-64;(第二次再切入1mm) G32 W-74.5; G00 U64.0; W74.5; …… 圆锥螺纹 外圆粗循环G71 编程格式:G71 U(⊿d) R(e) ;G71 P(ns) Q(nf) U(⊿U) W(⊿W) F(f) S(s) T(t); 式中:⊿d切深量,无符号指定。 端面粗循环G72 G72与G71均为粗加工循环指令,而G72是沿着平行于X轴进行切削循环加工的,编程格式为:G72U(⊿d) R(e) ;G72 P(ns) Q(ns) U(⊿u) W(⊿W) F(

    6.5K40编辑于 2022-03-30
  • 来自专栏爬虫资料

    从零开始:用Python爬取网站的汽车品牌和价格数据

    场景:在一个现代化的办公室里,工程师小李和产品经理小张正在讨论如何获取网站的汽车品牌和价格数据。小张:小李,我们需要获取网站上各个汽车品牌的价格和评价数据,以便为用户提供更准确的购车建议。

    98510编辑于 2025-02-12
  • 来自专栏IMWeb前端团队

    vue2.x-仿SPA-爆炸足球

    vue2.x—爆炸足球 模仿移动端,欢迎各位童鞋star github地址:https://github.com/vqlai/vue2-football 技术栈 前端 es6 vue2.x vue-router2 axios better-scroll vue-lazyload stylus 后端 通过webpack 设置HTTP代理的方式请求官网api获取数据 项目截图 ?

    75850发布于 2017-12-29
  • 来自专栏罗超频道

    汽车“新卖场”:直播间里找增量,电商绑定促成交

    《2021经销商直播价值白皮书》显示,用户中几乎每天都会在平台上观看直播的占比达到34%,每周观看4天以上直播的重度用户比例更是超过了45%。 现在直播卖已成为经销商们转型新零售的抓手,《2021经销商直播价值白皮书》显示,截至2021年5月,在平台开播的经销商账户数量已接近25000个。 在“2021经销商引力峰会”上海站上,宣布2022年卖通将进行全面升级,产品端将卖通与抖音直播全线打通,深度集成直播+电商的生态和能力,利用“生态打通、一机双播(可同时在和抖音双端直播 通过抓住移动与AI浪潮,后发而至的已成为汽车内容平台的头部玩家,在2021网销线索大盘中,同期线索占比超过31%。 用户画像方面,有将近70%的用户对汽车知识充满兴趣,而认为自己比亲友更汽车的用户比例也接近了55%。在用户习惯上,用户观看直播的习惯正在快速培育中。

    1.7K10编辑于 2022-12-14
  • 从今天起,“”要重新定义了

    当所有技术拼在一起:Inside The Game不只是一个产品,是NBA的新语言体系 NBA的部门负责人说: “我们不是为了创造酷炫的技术,而是为了让球迷更比赛。” 这句话太重要。

    16610编辑于 2026-01-13
  • 来自专栏Alter聊科技

    字节跳动进场,二手没等来新故事

    早在2017年的时候,今日头条的汽车频道就独立为APP,凭借算法推荐机制和优质内容,从汽车之家、易等平台那里分了一杯羹,同时也为字节跳动沉淀了足够的经销商资源,业务延伸到了汽车配件和整车销售。 参考““在重庆开设汽车体验店的尝试,字节跳动围绕新车宣发和销售的商业闭环已经初步成形,流量的出口不再只有广告,还可以导向线上和线下的销售,印证了巨量引擎营销副总裁陈都烨“我们要从流量驱动型转为生意驱动型 要知道字节跳动最擅长的就是探索出一个路径,然后进行体系化的复制,今日头条到抖音、西瓜视频是如此,到“”等业务也是如此。 2021年的经销商“引力峰会”上,相关负责人宣布卖通2022年将与抖音直播全线打通,经销商可以在和抖音平台“一机双播”, 通过直播与电商的绑定,帮助经销商进行线上卖。 可以窥知一二的是,的线下体验店曾计划以直营的模式运营,但在当地经销商的联手抵制下,被迫将店面租给当地的经销商。 在挣快钱和做产业之间,字节跳动会选择哪一个?

    48830编辑于 2023-01-13
  • 来自专栏新智元

    AEB测试「霸榜」!理想如何靠全栈自研逆袭成功?

    2022年1月11日,《》公布了最新一期上百款车型的AEB测试成绩。 在这一百多辆车里,理想ONE位居第一。 李想对此给出了答案:全栈自研。 「在年度AEB(主动安全)测试中成为了冠军,也是进入决赛组里唯一有能力准确识别横向车辆和两轮的车型,自从能够开展全栈自研以后,团队在算法和控制的进步速度远远超过了我的想象。」 白突然并入,AEB发出警报,如果司机没反应,系统就直接触发紧急制动,最终避免了碰撞。 重新回到最开始的AEB测试,为了选出年度最强车型,分别以时速40,50和60公里进行了加测。 来源: 更细腻的画质和更优异的暗光环境可以让理想ONE的辅助驾驶系统能更早发现危险⽬标。 2022年1月,理想ONE在的测试中不仅进入了决赛,甚至还战胜了以安全著称的沃尔沃。 此次理想在AEB代表的智能驾驶辅助方面,不仅实现了对自己,也实现了对大家固有认知的「逆袭」。

    59130编辑于 2022-02-24
  • 来自专栏日常学python

    为了一窥国足输韩国之后人们的评论,我爬了APP

    app截图 文章链接为:https://m.dongqiudi.com/article_share/896482.html 在配置好抓包之后,点击下方的评论,可以看到 ? 评论截图 ?

    64350发布于 2019-09-25
  • 来自专栏全栈程序员必看

    CORBA简介_吴聪简介

    1.CORBA:Common Object Request Broker Architecture,通用对象请求代理体系。是由对象管理组(Object Management Group, OMG)制定的一种标准的面向对象分布式应用程序体系规范,旨在为异构分布式环境中,硬件和软件系统的互联而提出的一种解决方案。

    1.5K10编辑于 2022-08-02
  • 来自专栏爬虫资料

    用深度学习提升DOM解析——自动提取页面关键区块

    一、时间轴:一次“抓不到重点”的二手数据爬虫事故2025/03/18 09:00 产品经理希望抓取平台上“北京地区二手报价”作为竞品监测数据源。 2025/03/19 10:00 启动深度学习方案:利用预训练模型BERT对HTML做块级语义识别,自动提取“卡片”结构与核心字段。二、方案分析:XPath失效 vs 语义块提取1. 深度学习方案构思将完整HTML节点转为token序列(含标签结构+文本);使用BERT或LayoutLM模型对DOM节点进行语义分类,标注“卡片”、“车型名”、“报价”等字段;利用位置+标签结构配合抽取规则 await browser.close()asyncio.run(main())四、总结与优化建议 深度学习DOM解析优点:抗结构变化能力强,不再依赖脆弱的XPath;适合复杂网页(如 、汽车之家等)中提取卡片、列表、评论等区域;可结合小样本微调适应特定领域,如二手、新闻等。

    39710编辑于 2025-05-26
  • 来自专栏爬虫资料

    Headless Chrome 优化:减少内存占用与提速技巧

    行业案例: 汽车点评数据采集:利用本方案采集【】上用户对指定车型的点评数据,企业能够实时跟踪市场反馈。 代码中参考了爬虫代理的相关信息(请根据实际情况替换代理域名、端口、用户名和密码),并针对目标网站【】解析指定车型的用户点评和得分。 # 关闭浏览器,结束爬虫任务 driver.quit() 注:上述代码中的 HTML 元素选择器(如 review-class、score-class、comment-class)均为示例,需要根据【

    75710编辑于 2025-03-31
  • 来自专栏Lan小站

    我是怎么成为资源

    我是怎么成为资源的——4-29课六 演讲目录 缘由 开始干货 软件收费,有广告? 吾爱破解 敲代码没思路? GitHub 看不懂英语? 网易云词典 电影收费? 最大资源网 音乐收费?

    1.1K10编辑于 2022-07-14
  • 来自专栏云计算linux

    基于python汽车数据分析大屏可视化系统,计算机毕业设计!实战全集教学

    java/spmvc ssm 2.csv文件,excel格式 3.存放到mysql,本地数据库sqlite3 4.djangoProject后台程序; 5.vue-data 数据展示; 准备工作: 打开:

    63410编辑于 2024-12-13
  • 来自专栏后厂村

    高合汽车:“欲戴王冠,必承其重”

    一石激起千层浪,此消息立刻在高合汽车的友群中炸了锅。 作为以70万元购买该款车型的车主,抖音网红“李老鼠说”在看到律师函中提到高合HiPhi X宣传时标明所用的音响为与捷豹、路虎等豪华品牌均有合作的世界高端知名音响品牌英国之宝(MERIDIAN),但有车主拆开后发现内部使用的是某国产品牌 在我买车之前,我以为音响硬件和软件都是英国之宝,甚至在专业的汽车媒体车型库上,(高合HiPhi X)扬声器品牌注明的也是英国之宝。” 而来源于的数据则表明:最便宜的高合HiPhi X是2022款智远版6座长续航版,指导价57万元,最贵的2021款旗舰版4座售价则高达80万元。 一直用高端、豪华、可靠的造实力来打破消费者对于国产低端、性价比的固有印象,当然也赢得了相当一部分用户的认可,然而,从今年7月开始,从行车记录仪的泄露隐私,到此次车主的集体维权,短时间内多起问题的爆发

    34010编辑于 2022-07-11
  • 来自专栏建帅技术分享

    爬虫网址合集

    from=navigation 彼岸壁纸 http://www.netbian.com/ https://www.dongchedi.com/usedcar/x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x-x 汽车之家 https://www.che168.com/china/list/#pvareaid=100945 酷爱漫画 https://www.kuimh.com/book/mh10575 瓜子二手

    5.6K20编辑于 2022-08-24
领券