我使用$html = file_get_html($url)->plaintext;如果我在某个循环中运行此代码,因为我希望访问一系列网站的文本,则从website.But获取纯文本,那么对于少数几个网站,它会引发错误,但是如果我只为该网站访问该函数,则会提取相同网站的纯文本。
发布于 2013-03-14 08:52:25
试试这个,让我知道我是在正确或错误的轨道上,你想要什么。首先,我在服务器上有两个html文件:
→页面1.html
<html>
<head><title>HTML Page #1</title></head>
<body><div id="a">A1</div><div id="b">B1</div><div id="b">B1</div></body>
</html>→page2.html
<html>
<head><title>HTML Page #2</title></head>
<body><div id="a">A2</div><div id="b">B2</div><div id="b">B2</div></body>
</html>.html页面:(与→文件位于同一个文件夹中)
require_once( 'simple_html_dom.php' ); // or w\e the path for your source is
// array to store series of websites:
$url = array( './page1.html', './page2.html' );
// array to hold plain-text for later retrieval: (if needed)
$html = array();
// loop through series of webpages:
foreach( $url as $key=>$value ) {
// get html plain-text for webpage & assign to html array.
$html[ $key ] = file_get_html( $value )->plaintext;
// echo html plain text:
echo "<br />" . $html[ $key ] . "<br />";
}
// echo $html[ 0 ]; /* <-- page1.html (if needed) */
// echo $html[ 1 ]; /* <-- page2.html (if needed) */→输出:
HTML Page #1 A1B1B1
HTML Page #2 A2B2B2 可以完成您想要代码做的事情吗?
https://stackoverflow.com/questions/15403669
复制相似问题