首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >去除“美汤”中的标签

去除“美汤”中的标签
EN

Stack Overflow用户
提问于 2019-03-15 13:50:45
回答 1查看 137关注 0票数 0

我想删除html标签,但保留标签之间的文本并将其保留在列表中。这是我的以下代码:

代码语言:javascript
复制
comment_list = comment_container.findAll("div", {"class" : "comment-date"})
print(comment_list)

输出为:

代码语言:javascript
复制
[<div class="comment-date">2018-9-11 03:58</div>, 
 <div class="comment-date">2018-4-4 17:10</div>, 
 <div class="comment-date">2018-4-26 01:06</div>, 
 <div class="comment-date">2018-7-19 13:48</div>, 
 <div class="comment-date">2018-4-12 11:39</div>, 
 <div class="comment-date">2019-3-14 21:12</div>, 
 <div class="comment-date">2019-3-4 15:43</div>, 
 <div class="comment-date">2019-3-12 13:20</div>, 
 <div class="comment-date">2019-3-10 22:32</div>, 
 <div class="comment-date">2019-3-8 15:22</div>]

所需输出:

代码语言:javascript
复制
[2018-9-11 03:58, 2018-4-4 17:10, 2018-4-26 01:06, 
2018-7-19 13:48, 2018-4-12 11:39, 2019-3-14 21:12, 
2019-3-4 15:43, 2019-3-12 13:20, 2019-3-10 22:32, 2019-3-8 15:22]

我可以使用for循环逐个提取文本。

代码语言:javascript
复制
for commentDate in comment_list:
    comments = commentDate.text
    print(comments)

我想使用日期进行比较(找到最早的日期),因此我觉得将日期保存到列表中将是最容易管理的。

EN

回答 1

Stack Overflow用户

发布于 2019-03-15 14:02:53

您可以像这样使用列表理解将div元素列表转换为日期列表,以获得所需的输出:

代码语言:javascript
复制
comment_list = comment_container.findAll("div", {"class" : "comment-date"})
comment_dates = [comment.text for comment in comment_list]
print(comment_dates)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55176318

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档