首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法在ATag中获取字符串

无法在ATag中获取字符串
EN

Stack Overflow用户
提问于 2020-06-16 22:40:43
回答 3查看 53关注 0票数 2

我是初学者,所以请多多关照。我正在使用Beautiful Soup来解析一些html。我已经找到了这个标签

代码语言:javascript
复制
a_tag = <a href="sicc2020/results?pid=31022">S<span class="notCompact">hakira</span> Mirfin</a>

我想从这个字符串中去掉"S“、"hakira”和"Mirfin“。但是,当我使用.string函数时,它只显示为none。我能听懂“hakira”的部分,但听不懂"S“或"Mirfin”。

代码语言:javascript
复制
print(a_tag)
>><a href="sicc2020/results?pid=31022">S<span class="notCompact">hakira</span> Mirfin</a>

print(a_tag).string
>> None

print(a_tag).find('span').string
>>hakira

任何帮助都将不胜感激!

谢谢。

EN

回答 3

Stack Overflow用户

发布于 2020-06-16 22:59:14

你可以尝试一下:

代码语言:javascript
复制
from bs4 import BeautifulSoup
html_doc="""<a href="sicc2020/results?pid=31022">S<span class="notCompact">hakira</span> Mirfin</a>"""

soup = BeautifulSoup(html_doc, 'lxml')
text = soup.find("a").get_text(",", strip=True)

print(text)

输出将为:

代码语言:javascript
复制
S,hakira,Mirfin
票数 1
EN

Stack Overflow用户

发布于 2020-06-16 22:45:17

只需这样做:

代码语言:javascript
复制
var text_array;
var children = document.getElementById(id).childNodes;

text_array.push(document.getElementById(id).textContent)

  for (var i = 0; i < children.length; i++) {
    text_array.push(children[i].textContent)
  }

如果您想要删除所有内容:

代码语言:javascript
复制
var children = document.getElementById(id).childNodes;

document.getElementById(id).textContent = ""

  for (var i = 0; i < children.length; i++) {
    children[i].textContent = ""
  }

如果它对你的"S“和"Mirfin”不起作用,你可以这样做:

代码语言:javascript
复制
$("#id")
.clone()    //clone the element
.children() //select all the children
.remove()   //remove all the children
.end()  //again go back to selected element
.text();
票数 0
EN

Stack Overflow用户

发布于 2020-06-17 06:13:18

另一种方法。

代码语言:javascript
复制
from simplified_scrapy import SimplifiedDoc,req,utils
html ='''<a href="sicc2020/results?pid=31022">S<span class="notCompact">hakira</span> Mirfin</a>'''
doc = SimplifiedDoc(html)
print (doc.a.text)

结果:

代码语言:javascript
复制
Shakira Mirfin

这里有更多的例子:https://github.com/yiyedata/simplified-scrapy-demo/tree/master/doc_examples

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62411151

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档