首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Web使用python抓取网页的控制台

Web使用python抓取网页的控制台
EN

Stack Overflow用户
提问于 2021-12-22 07:54:51
回答 1查看 300关注 0票数 0

我有一段代码,它可以在网页上搜索某个网站,并打印出它在该网页上找到的内容。

我对此非常陌生,如何才能仅仅从控制台收集数据,就像图片中所看到的那样。

检查控制台

这是目前为止的代码,谢谢您的帮助

代码语言:javascript
复制
import requests

url = 'url goes here'
r = requests.get(url)
print(r.text)
EN

回答 1

Stack Overflow用户

发布于 2021-12-22 08:10:14

以下是收集输出的一些方法:

  1. 如果数据非常小,格式也很好,就像每个URL只有1行,那么您可以从控制台打印的输出中复制输出。
  2. 如果数据非常大,我假设这就是您的情况,您可以将输出写入文件中。
代码语言:javascript
复制
    import requests
    
    url = 'url goes here'

    r = requests.get(url)
    
    print(r.text)  
    
    with open('/path/to/file.txt', 'w', encoding='utf-8') as f:
    
        f.write('r.text')
  1. 如果您有数千个URL,并且需要写入1000个文件,只需为每个url添加一个for循环,并将输出写入不同的文件。

上面的例子是使用txt文件,您也可以将输出写入.xml文件或.html文件,任何更方便您重用的格式,如docx、excel、csv、json等。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70445810

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档