首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >lxml可以解析python中的部分tr

lxml可以解析python中的部分tr
EN

Stack Overflow用户
提问于 2012-09-06 14:44:05
回答 1查看 136关注 0票数 0

当我使用lmxl解析一个web时,lxml-xpath可以得到target的一部分,请看我的代码:

代码语言:javascript
复制
import urllib
import lxml.html
url="http://sc.hkex.com.hk/gb/www.hkex.com.hk/chi/market/sec_tradinfo/stockcode/eisdeqty_c.htm" 
file=urllib.urlopen(url).read() 
root=lxml.html.document_fromstring(file)
for company in root.xpath('//tr[@class="tr_normal"]'):
    print  company.text_content().encode('utf-8')  

>>>00325创生控股1,000#     
00326中国星集团50,000#     
00327百富环球1,000  
00328ALCO HOLDINGS2,000#     
00329  
>>> 

有两个问题:

1.为什么我只能得到000329?对方失去了?

2.为什么拿不到编码大于000329的公司信息?

EN

回答 1

Stack Overflow用户

发布于 2012-09-06 15:44:03

read()不会一次读取整个页面。您需要对其进行迭代

从文档中:

如果size参数被省略或为负数,则

()方法在数据流结束之前可能无法读取;在一般情况下,没有好的方法来确定是否已读取来自套接字的整个流。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12294355

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档