我需要依次解析许多xml树..。我做了一个' for‘循环,它对第一个文件非常有效,但是当启动第二个文件时,它只需要花费很长时间,并且不会输出答案或其他文件的后续操作。
我有3个文件,它们都是同一个文件的副本,具有不同的名称来尝试循环,这些文件的名称如下:
Medline_01.xml
Medline_02.xml
Medline_03.xml
我正在尝试下面的循环:
import xml.etree.cElementTree as etree
import os
path = '/Users/brunap/Desktop/Work/Medline'
listing = os.listdir(path)
for file in listing:
if file.endswith('.xml'):
print file
data = os.path.join(path, file)
tree=etree.parse(data)
root = tree.getroot()
print root
print ""它给了我以下结果
Medline_01.xml
<元素'PubmedArticleSet‘在0x10878bd80 >
Medline_02.xml
记者:从这个开始,我等了两个小时,什么也没发生。第一个花了15分钟
有人能帮我吗?
发布于 2015-11-30 17:02:27
实际上,脚本很好,问题是文件太大了,计算机的内存没有处理运行脚本,杀死了它,并且永远不跟随它。当在HPC集群中尝试时,它工作得非常完美,而且速度更快。
无论如何,谢谢你的建议,帮我解决其他的问题。:)
https://stackoverflow.com/questions/33923146
复制相似问题