首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >标准规范现行状态批量查询 — 一次性完成指令模板

标准规范现行状态批量查询 — 一次性完成指令模板

原创
作者头像
用户12488154
修改2026-05-15 14:02:09
修改2026-05-15 14:02:09
50
举报

将以下指令一次性提交,即可完成从 Excel 读取标准清单 → 自动查询 → 更新 Excel 结果的全部工作,无需多轮沟通。

请根据以下要求,从 Excel 中读取标准规范清单,批量查询各标准的现行状态,并将结果写回 Excel:

输入文件

  • Excel 文件路径:替换为实际路径,如 D:/工作/标准规范清单.xlsx
    • 工作表名:"Sheet1"(或按实际情况填写)
    • 标准编号列:第X列(如第2列)
    • 标准名称列:第X列(如第3列)
    • 现行状态结果列:第X列(如第6列,用于写入查询结果)

查询方式

  • 查询网站:(全国标准信息公共服务平台)
  • 使用 Playwright 自动化浏览器完成查询
  • 每个标准尝试多种搜索关键词(原始格式、去空格、去年份)

查询结果判断逻辑

  • 页面出现"现行"+"有效"或"实施" → 标注"现行有效"
  • 页面出现"废止"或"作废" → 标注"已废止(被替代)",并提取替代标准号
  • 页面出现"代替"或"替代" → 标注"已废止(被替代)"
  • 未找到结果 → 标注"未查询到,需人工确认"
  • 找到结果但无法判断 → 标注"需人工确认"并截图

输出要求

  • 将查询结果写回 Excel 对应行的"现行状态"列
  • 同时保存一份 JSON 结果文件:query_results_YYYYMMDD.json
  • 对每个标准截图保存(路径:e:/claw/screenshots/)

技术实现

  • Python + Playwright(sync API)
  • 浏览器:Chromium,headless=False 以便调试
  • 每次查询间隔 3 秒,避免被封
  • 工作目录:e:/claw/

注意事项

  • 如 Excel 中"现行状态"列已有值(非空),可选择跳过或覆盖(默认跳过已填写项)
  • 标准编号中的斜杠 "/" 在搜索时可尝试替换为连字符 "-"
  • 部分行业标准(如 CNCIA-HG 等)可能无收录,需标注"网站未收录"

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 输入文件
  • 查询方式
  • 查询结果判断逻辑
  • 输出要求
  • 技术实现
  • 注意事项
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档