当在Windows上运行svndumpfilter2时,我遇到了一个问题,这个问题的根源在于转储文件有时会有CRLF结尾。
SVN数据库中的某些文件具有CRLF行结尾。但Python似乎将CRLF视为一个字符(不将CR字符与文件内容中的后续LF分开计算)。因此,它无法读取正确数量的字符,并且错过了下一个块的开始。
所以我的问题是:如何告诉Python将CRLF视为两个独立的字符?
流是从sys.stdin中读取的,所以我正在寻找一种方法来更改标准输入的换行符属性。在Python中做到这一点的“唯一正确的方法”是什么?
发布于 2011-07-04 18:32:46
更新:我想到的一种方法是显式地将stdin的模式设置为二进制。因此,类似于下面的内容将CRLF读取为两个字符:
import msvcrt, os, sys
msvcrt.setmode(sys.stdin.fileno(), os.O_BINARY)
while True:
ch = sys.stdin.read(1)
print ord(ch) # CRLF should appear as 13 followed by 10另一种方法是使用-u标志启动python,这会导致无缓冲的stdin (以及stdout和stderr)。所以只需要在python -u myscript.py中,myscript.py调用stdin.read(1)而不做其他更改。有关这方面的更多信息,请参见python --help。
旧的:如果你在windows上,当你调用sys.stdin.readline (或者简单地迭代sys.stdin,它是一个类似object的文件)时,Python应该能够在没有任何干预的情况下处理这个问题。您是否正在使用sys.stdin.read?如果是这样的话,你需要自己处理这种情况。
https://stackoverflow.com/questions/6569920
复制相似问题