我一直在尝试提取和抓取有关为joda-time软件归档的bug的信息。但是,我发现没有好的方法可以使用自动脚本或其他方法将此信息导出到文件中。我确实在网上找到了一些python脚本,但它们大多是关于将sourceforge票证转换为git或过时的。
在这件事上的任何帮助都将非常感谢。
谢谢,Shivani
发布于 2012-07-09 03:25:23
您可以使用BeautifulSoup编写抓取脚本。您可以通过使用BeautifulSoup编写一些Python代码,从joda-time软件的每个bug工单页面的超文本标记语言中提取必要的信息。这并不困难,然后您可以对提取的信息执行您想要的操作。
发布于 2012-07-09 03:26:30
对不起,我听不懂你的问题。如果您的问题是如何将文件提取为HTML并另存为HTML
您可以使用urllib:http://docs.python.org/library/urllib.html
发布于 2012-07-09 04:03:01
如果您是项目管理员,则可以使用export to xml选项。
您可能还会发现Migrate sourceforge tickets to GitHub issues很有用。
https://stackoverflow.com/questions/11385738
复制相似问题