文章/答案/技术大牛

发布

社区首页 >问答首页 >pyqt4:循环主渲染类？

问pyqt4:循环主渲染类？
EN

Stack Overflow用户

提问于 2016-01-05 03:53:20

回答 2查看 690关注 0票数 2

我有一个PyQt4类，可以下载用于报废目的的网页。

当我在实例化时将url列表传递给Render类时(单次调用)，但是当我尝试用多个url列表循环r= Render(url，cb=scrape)时，在第一个循环之后，执行将停止或挂起，而不会引发任何错误。

我想单独循环类，因为urls列表属于不同的类别，并且必须存储单独提取的内容。

我也知道只有一个应用程序可以启动，如果是这样的话，如何退出应用程序而不退出它。这样，新的url列表就可以被同一个应用程序使用。

我被这个问题困扰了一段时间。提前感谢

import sys
from PyQt4.QtCore import *
from PyQt4.QtGui import *
from PyQt4.QtWebKit import *

class Render(QWebPage):  
  def __init__(self, urls, cb):
    self.app = QApplication(sys.argv)  
    QWebPage.__init__(self)  
    self.loadFinished.connect(self._loadFinished)  
    self.urls = urls  
    self.cb = cb
    self.crawl()  
    self.app.exec_()  

  def crawl(self):  
    if self.urls:  
      url = self.urls.pop(0)  
      print 'Downloading', url  
      self.mainFrame().load(QUrl(url))  
    else:  
      self.app.quit()  

  def _loadFinished(self, result):  
    frame = self.mainFrame()  
    url = str(frame.url().toString())  
    html = frame.toHtml()  
    self.cb(url, html)
    self.crawl()  

def scrape(url, html):
    pass # have scraping code here

url1 = ['http://webscraping.com', 'http://webscraping.com/blog'] 
url2 = ['http://webscraping.com', 'http://webscraping.com/blog']
urls =[]
urls.append(url1)
urls.append(url2)

for url in urls:
    r = Render(url, cb=scrape)

pyqt4

python

python-2.7

events

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-01-07 00:40:55

问题是您只能实例化单个QApplication对象。下面是一个更新的版本，它避免了这种情况，然后在下载URL时只运行Qt的执行循环：

import sys
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl
from PyQt4.QtWebKit import QWebPage

class Render(QWebPage):
  def __init__(self, cb):
    self.app = QApplication(sys.argv)
    QWebPage.__init__(self)
    self.loadFinished.connect(self._loadFinished)
    self.cb = cb

  def crawl(self, url):
    print 'Downloading', url
    self.mainFrame().load(QUrl(url))
    self.app.exec_()

  def _loadFinished(self, result):
    frame = self.mainFrame()
    url = str(frame.url().toString())
    html = frame.toHtml()
    self.cb(url, html)
    self.app.quit()


def scrape(url, html):
  pass # add scraping code here
  print len(html)


r = Render(cb=scrape)
urls = ['http://webscraping.com', 'http://webscraping.com/blog']
for url in urls:
    r.crawl(url)

票数 1

Stack Overflow用户

发布于 2016-07-05 11:53:42

不幸的是，@hoju的回答对我没有用。

下面是对我有用的内容(基本上是设置一个计时器来检查加载是否已经完成)。

import sys
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl, QTimer
from PyQt4.QtWebKit import QWebPage


class Render(QWebPage):
    def __init__(self, url):
        QWebPage.__init__(self)
        self.frame = None
        self.mainFrame().loadFinished.connect(self._loadFinished)
        self.mainFrame().load(QUrl(url))

    def _loadFinished(self, result):
        self.frame = self.mainFrame()

def go_again():
    global r, timer, urls
    if(len(urls)>0):
        print("loading",urls[0])
        r = Render(urls.pop())
        timer.start(1000)
    else:
        print("finished")
        sys.exit(app.exec_())

def check_done():
    global r, timer
    if r.frame is not None:
        timer.stop()
        html_result = r.frame.toHtml()
        #do something with html
        print("loaded")
        go_again()

app = QApplication(sys.argv)
urls = ['http://stackoverflow.com/questions/34603886/pyqt4-loop-main-render-class','http://stackoverflow.com/questions/34603886/pyqt4-loop-main-render-class']

timer = QTimer()
timer.timeout.connect(check_done)
#check every second
go_again()
sys.exit(app.exec_())

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34603886

复制

相似问题

问pyqt4:循环主渲染类？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问pyqt4:循环主渲染类？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问pyqt4:循环主渲染类？
EN