前两天找个东西,记得有在浏览器存了书签,好不容易找到了,打开竟然无法访问了。当时就在想,咋整理一下这些书签,清理一下无效的。
那怎么判断哪些是无效的?它应该有以下几个特点:
1. 返回403、404等状态码;
2. 访问超时,比如等待10秒还无法获取数据,大概是打不开了
3. 连接失败、SSL证书错误等
如何识别到所有书签?在浏览器上操作不方便,那就导出来!
浏览器——收藏夹——导入/导出收藏夹——保存为html文件

打开软件或自行运行py代码,按提示输入导出的书签文件路径,回车确认。


结果输出到 bookmark_check.csv

对上面结果自行处理下就好了。
为了不背锅,没弄删除失效书签的代码,原因如下:
1. 需要访问国外网站的网站本身就无法直接打开,必误判!
2. 个别网站会抽风,会误判。
代码主要是解放双手,提升效率。如果你要杠说有很多需要删除的,我建议先想想为何你的书签那么多失效的?实在想删,让AI修改下代码即可。
为了方便没有python环境的朋友,我把代码编译成exe(含源码)。公众号回复:书签 获取。
- End -
更多精彩文章
点击下方名片关注【偶尔敲代码】
