我想读取用户在Python语言中的输入,以获得一个url (例如http://www.google.com),然后将网页以HTML格式(仅文本)打印到终端。我尝试使用pexpect.spawn('elinks'),但是elinks似乎不能写入标准输出。我还查看了HTMLParser模块,但我不知道如何将生成的文本格式化为类似网页的内容。有什么建议吗?
发布于 2011-12-05 01:58:12
这是一个不小的挑战。你想要产生elinks的事实让我想知道你为什么不直接使用它。看看它有哪些可扩展性/插件/插件选项,或者尝试重写它以满足您的特定需求。
最终,您将需要编写自己的浏览器布局引擎和curses后端。如果您使用的是python,那么urwid是一个流行的诅咒布局选择。
发布于 2011-12-05 06:40:20
使用python urllib
在控制台中输入url --> urllib -->页面-->打印
# example in the python urllib page
import urllib
opener = urllib.FancyURLopener({})
f = opener.open("http://www.python.org/")
f.read()
# modify:
html = f.read()
# add:
print html
# to print in terminal它类似于unix中的"curl“
发布于 2014-09-27 12:39:43
import requests
r = requests.get('http://www.google.com/')
print(r.content)https://stackoverflow.com/questions/8377246
复制相似问题