我想阻止所有的机器人(如HTTrack)在我的网站。通常,我会使用.htaccess文件通过RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR]阻止机器人。
RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR]
但是,我的服务器正在运行Node.js Express。如何获得HTTP_USER_AGENT并在Node.js上执行块或重写?
发布于 2016-04-25 17:00:11
有一个中间件,叫做快车-nobots。
var noBots = require('express-nobots'); // must be the first middleware app.use(noBots());
您可以看到阻塞的机器人列表在源文件中。
https://stackoverflow.com/questions/36846136
相似问题