我有一个包含这种列表的网页,大约有500个条目:
<br><a href="urlvalue" >URL Name 1</a> text</br>
<br><a href="urlvalue" >URL with a longer url</a>text</br>
<br><a href="urlvalue" >URL Name3 and this one too?</a> text</br>我想将此页上的数据导入到excel中。因此,我想将这里的数据转换为如下所示:
URL value | URL Name | Text 我实际上满足于:
URL value | URL Name我使用的是:
我使用了simple-html-dom
<?php
require ('simple_html_dom.php');
$html = file_get_html('Etext_alt2.html');
foreach($html->find('a') as $element)
echo $element->href .'<br>';
?>这给了我一个很好的URL值列表。
看起来我应该能够访问其他属性,但都不起作用。
我用错东西了吗?做这件事最好的方法是什么?
发布于 2012-12-15 04:36:21
不解析HTML的任务的工作示例:
$html = '<br><a href="urlvalue" >URL Name 1</a> text</br>
<br><a href="urlvalue" >URL with a longer url</a>text</br>
<br><a href="urlvalue" >URL Name3 and this one too?</a> text</br>';
preg_match_all('#<br><a href="(.*)" >(.*)</a>(.*)</br>#', $html, $matches, PREG_SET_ORDER);
foreach ($matches as $row) {
echo "{$row['1']} | {$row['2']} | {$row['3']}" . PHP_EOL;
}https://stackoverflow.com/questions/13885610
复制相似问题