问提取关键部分内容包含在<b>标记中的字符串
EN

Stack Overflow用户

提问于 2019-03-18 00:48:58

回答 1查看 23关注 0票数 1

从一个web请求中，我得到了这样的答案：

    <table>

    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">quiero</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>AUX</b></td>


    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>QUERER</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;singular&nbsp;&nbsp;1&nbsp;&nbsp;presente indicativo&nbsp;</b></td>


    </tr>


    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">ser</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>V</b></td>


    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>SER</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;infinitivo&nbsp;</b></td>


    </tr>


    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">el</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>ART</b></td>

    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>EL</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;masculino&nbsp;&nbsp;singular&nbsp;</b></td>


    </tr>


    <tr>


    <td style="font-size:110%;color:blue;font-weight:bold">mejor</td>

    <td style="font-style:italic;">categoría&nbsp;&nbsp;&nbsp;<b>ADJ</b></td>


    <td style="font-style:italic;">lema&nbsp;&nbsp;&nbsp;<b>MEJOR</b></td>


    <td style="font-style:italic;">rasgos&nbsp;&nbsp;&nbsp;<b>&nbsp;singular&nbsp;</b></td>


    </tr>


    </table>

但我只对获取<b>标记中的所有内容感兴趣。有没有最好的方法呢？据我所知，我只能使用.split实现它，但我不认为它是一种非常优雅或非常优化的实现方式

这是我想要的输出：

v
SER
&nbsp;infinitivo&nbsp;
ART
El
&nbsp;masculino&nbsp;&nbsp;singular&nbsp;
.
.
.

这是我对请求的字符串响应

python

回答 1

Stack Overflow用户

发布于 2019-03-18 01:00:20

您可以使用html.parser

from html.parser import HTMLParser

class BExtractor(HTMLParser):
    def __init__(self, *args, **kwargs):
        super(BExtractor, self).__init__(*args, **kwargs)
        self.is_b = True

    def handle_starttag(self, tag, attrs):
        if tag == "b":
            self.is_b = True

    def handle_endtag(self, tag):
            self.is_b = False

    def handle_data(self, data):
        if self.is_b:
            print(data)

parser = BExtractor()
parser.feed("""html""")

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55209479

复制

相似问题

问提取关键部分内容包含在<b>标记中的字符串
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提取关键部分内容包含在<b>标记中的字符串EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提取关键部分内容包含在<b>标记中的字符串
EN