如何使用抓取一个网站并从一个公共静态html文件中提取一个url的方式来编写Power Shell脚本?
我在获取链接时遇到了问题,我只能获取包含该链接的行。
‘’Invoke WebRequest‘下载并保存html文件。
我想要的链接以.m3u8结尾,所以我使用
‘’Select String‘搜索.m3u8,PowerShell返回一行。但我想要一个链接,而不是一行,该行包含其他我不想要的普通html标记。链接用双引号括起来,以.m3u8结尾。我想要引文中的内容。
我应该使用split将行转换为数组吗?
我是否应该使用正则表达式来“只获取引号中的内容”?如果是这样,又是如何做到的呢?
$variable_text = index.html
$variable_line = sls .m3u8 $variable_text
$variable_url = sls "regex inside of the quotes" in $variable_line当我在google上搜索正则表达式并将它们输入到powershell中时,该命令将返回">>“。也许我的问题出在语法上?在线正则表达式检查工具可以工作,但当我将该正则表达式放入powershell中时,它永远不会工作。非常感谢您的宝贵时间。
发布于 2018-03-15 17:51:15
不需要下载网站或解析所有行。Invoke-Webrequest cmdlet包含一个名为links的属性。
获取所有链接并搜索m3u8链接的示例:
$WebSite = Invoke-WebRequest -Uri "your website"
$Links = $WebSite.Links.href
$Links | Where-Object{$_ -like "*.m3u8"} #Will show you all links which end with .m3u8https://stackoverflow.com/questions/49290118
复制相似问题