首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用XPath python从同一个td中的href中分离文本

使用XPath python从同一个td中的href中分离文本
EN

Stack Overflow用户
提问于 2018-10-24 14:31:39
回答 3查看 160关注 0票数 1

我有这样一个HTML网页:

代码语言:javascript
复制
<tr><td style="text-align:center;">7</td><td class="multi_row" style="line-height:15px;">Loaded on 'NYK LEO 303W' at Port of Loading<br> <a href="JavaScript:void(0);" style="line-height:15px;" title="NYK LEO" data-click="vesselPop" data-cd="NLZT0303W">NYK LEO 303W</a></td><td class="multi_row" style="line-height:15px;">VANCOUVER, BC ,CANADA<br>  <a href="JavaScript:void(0);" style="line-height:15px;" onclick="openLocationPopup('CAVAN01')" title="3891 DELTAPORT GCT">3891 DELTAPORT GCT</a></td><td class="ico_e">2018-10-26 23:30</td></tr>

我希望将<a href>的字符串部分分离到一个变量中,在另一个变量中有一个纯文本,比如“bla”。到目前为止,这就是我所做的:

代码语言:javascript
复制
event_path = driver.find_elements_by_xpath("//table[@id='detail']//tr/td[2]")
event = [cell.text for cell in event_path]

它用于文本部分,此部分用于字符串:

代码语言:javascript
复制
vessel_path = driver.find_elements_by_xpath("//table[@id='detail']//tr/td[2]/a")
vessel = [cell.text.split(' ')[:2] for cell in vessel_path]

split(' ')[:2]是因为数据是这样的:NykLeo303 W,我只需要单词而不是数字(用regex可以做得更可靠)。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2018-10-24 14:35:48

尝试使用下面的方法只从td获取第一个文本节点

代码语言:javascript
复制
event = [driver.execute_script('return arguments[0].firstChild.textContent;', cell).strip() for cell in event_path]
票数 2
EN

Stack Overflow用户

发布于 2018-10-24 14:46:55

请尝试使用以下代码:

代码语言:javascript
复制
elements = driver.find_elements_by_classname("multi_row")

for element in elements
    print(element.text)
票数 0
EN

Stack Overflow用户

发布于 2018-10-24 20:52:22

在你的例子中,我看到你期待的船只已经出现在锚的标题属性中。

如果这是一个有效的案例,你可以直接从服装中得到,

代码语言:javascript
复制
vessel_path = driver.find_elements_by_xpath("//table[@id='detail']//tr/td[2]/a")
vessel = [cell.get_attribute("title") for cell in vessel_path]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52971601

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档