首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在漂亮的Python中提取锚点标记之间的文本?

在漂亮的Python中提取锚点标记之间的文本?
EN

Stack Overflow用户
提问于 2014-05-19 12:16:44
回答 1查看 1.3K关注 0票数 1

我正在尝试提取这个fandango页面上列出的电影的名称。

代码语言:javascript
复制
names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})

这是在其中保留名称的锚类。问题是,当我运行代码时,输出是:

代码语言:javascript
复制
<a class="dark showtimes-movie-title" href="http://www.fandango.com/godzilla3d_170083/movieoverview">Godzilla 3D</a>

当我在Godzilla 3D中想要的。如何才能成功解析此数据?

代码语言:javascript
复制
#anchor element containing the names of each movie
names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})
names_tag = str(names_tag)

movie_name = names_tag.split(',')

for each_line in movie_name:
    movie_names.append(each_line)

i = 0
while (i < len(movie_names)):

    print 'The length of %s is %s' %(movie_names[i], movie_times[i])

    i+=1
EN

回答 1

Stack Overflow用户

发布于 2014-05-19 12:20:28

使用text属性:

代码语言:javascript
复制
names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})
names = [name_tag.text for name_tag in names_tag]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23729636

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档