首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >提取关键部分内容包含在<b>标记中的字符串

提取关键部分内容包含在<b>标记中的字符串
EN

Stack Overflow用户
提问于 2019-03-18 00:48:58
回答 1查看 23关注 0票数 1

从一个web请求中,我得到了这样的答案:

代码语言:javascript
复制
    <table>

    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">quiero</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>AUX</b></td>


    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>QUERER</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;singular&nbsp;&nbsp;1&nbsp;&nbsp;presente indicativo&nbsp;</b></td>


    </tr>


    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">ser</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>V</b></td>


    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>SER</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;infinitivo&nbsp;</b></td>


    </tr>


    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">el</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>ART</b></td>

    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>EL</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;masculino&nbsp;&nbsp;singular&nbsp;</b></td>


    </tr>


    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">mejor</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>ADJ</b></td>


    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>MEJOR</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;singular&nbsp;</b></td>


    </tr>


    </table>

但我只对获取<b>标记中的所有内容感兴趣。有没有最好的方法呢?据我所知,我只能使用.split实现它,但我不认为它是一种非常优雅或非常优化的实现方式

这是我想要的输出:

代码语言:javascript
复制
v
SER
&nbsp;infinitivo&nbsp;
ART
El
&nbsp;masculino&nbsp;&nbsp;singular&nbsp;
.
.
.

这是我对请求的字符串响应

EN

回答 1

Stack Overflow用户

发布于 2019-03-18 01:00:20

您可以使用html.parser

代码语言:javascript
复制
from html.parser import HTMLParser

class BExtractor(HTMLParser):
    def __init__(self, *args, **kwargs):
        super(BExtractor, self).__init__(*args, **kwargs)
        self.is_b = True

    def handle_starttag(self, tag, attrs):
        if tag == "b":
            self.is_b = True

    def handle_endtag(self, tag):
            self.is_b = False

    def handle_data(self, data):
        if self.is_b:
            print(data)

parser = BExtractor()
parser.feed("""html""")
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55209479

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档