我使用simple_html_dom [ http://sourceforge.net/projects/simplehtmldom/ ]来解析HTML。
我试图获取所有的<script> urls,获取内容,然后在$html变量中替换它.我有这个,就像我想要的那样:
$html_elements = str_get_html( $html );
$current_src = array( );
$new_src = array( );
foreach($html_elements->find('script') as $element) {
if( $element->src != '' )
{
$script_url = $element->src;
$script_data = get_script( $script_url );
$current_src[] = $element->outertext;
$new_src[] = "<script>" . $element->innertext . "\n" . $script_data . "</script>";
}
}
$html = str_replace( $current_src, $new_src, $html );
function get_script( $url )
{
$data = file_get_contents( $url );
return $data;
}问题是,它似乎是把javascript文件中的加号转到空格上,而这一切都说了又做了吗?
发布于 2013-12-12 04:12:09
请参阅上述评论部分。
在进一步调试之后,我在代码中稍后通过urldecode()对数据进行了一至多次解析。
https://stackoverflow.com/questions/20533716
复制相似问题