我正在使用和服实验室来抓取一堆网站。我想从URL中提取个人‘d,这是我使用和服生成的HTML属性。Kimono只允许regex使用这种格式-
/^()(.*?)()$/我有一堆这种典型格式的URLs
http://www.abcde.com/inferno-english/p/itmdzhspdfkfszyk?pid=9780593072493&srno=b_3&ref=e32b55b4-b0b0-413d-b76c-a41ad93247a5我用什么正则表达式来提取"pid=“后面的13位数字?
发布于 2014-09-10 19:34:22
pid=(\d{13})您可以使用this.See演示。
http://regex101.com/r/dM0rS8/1
发布于 2014-09-10 19:34:21
组索引1包含紧接在to pid=之后出现的13位数字,
/^.*?pid=(\d+).*$/DEMO
或
为了得到准确的13位数,
/^.*?pid=(\d{13}).*$/DEMO
发布于 2014-09-10 19:36:03
使用正向回溯:
(?<=pid=)\d{13}演示:http://regex101.com/r/bA0jG5/1
https://stackoverflow.com/questions/25764300
复制相似问题