我对Python很陌生,这也是我的第一种编程语言。我有一组txt文件(学术论文),我需要提取论文ID (例如ID: a1111111)和摘要(例如摘要:.)。我不知道如何从多个文件夹中提取这些数据?非常感谢!
发布于 2014-02-24 05:17:58
所以你的问题有两个部分:读取文件和访问文件夹。
用于读取文件的python中的方法/对象位于Python第7章的文档中:http://docs.python.org/2/tutorial/inputoutput.html
基本要点是使用open方法访问位于同一目录中的文件。
f = open('stuff.txt', 'r')
其中stuff.txt是与您的python文件所在目录中文件的名称相同的文件。调用print f.read()将显示文件的文本(字符串格式)。可以随意地将f.read()分配给一个变量来捕获数据。
>>> x = f.read()
>>> print x
This is the entire file.\n最好阅读所有这些方法的文档,因为有一些微妙之处。例如,调用f.read()一次会将整个文件内容返回给您,但是再次调用f.read()将返回一个空字符串,因为“已到达文件的末尾”。
你能解释一下你到底想怎么访问文件夹吗?在这种情况下,将所有文件放在与运行python文件的目录相同的目录中就更容易了。但是,在python中移动的基本方法是使用:os.chdir(path),它基本上是cd‘’ing。在使用此文件之前,必须导入os。
如果你想要更多信息,请留言
https://stackoverflow.com/questions/21979163
复制相似问题