sample = ",,"
values = shlex.shlex(sample, posix=True)
values.quotes = '"'
values.whitespace = ','
values.whitespace_split = True
received_output = list(values)在上面的代码示例中,我希望["", "", ""]作为received_output的值,但是received_output只是一个空列表[]。关于如何接收这种预期的行为,似乎没有任何信息。
这在sample.split(',')中很好,但我更喜欢使用shlex,因为我有一些带有标记的复杂句子,如果组的一部分(例如下面的示例中的纬度、经度)不应该分割这些标记。
另一个例子是:
sample = '9267,BELMONT,KEELER,,62.4,35.2,10/01/2012,Weekday,"(41.93897000, -87.73212000)"'
expected_output = ['9267', 'BELMONT', 'KEELER', '', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
retrieved_output = ['9267', 'BELMONT', 'KEELER', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']发布于 2016-02-16 21:27:18
shlex文档状态:
如果您想要在输出中包含空字符串,那么shlex库是作业的错误工具。
正如@PadraicCunningham在评论中指出的那样,csv (逗号分隔值)库在这方面应该工作得很好:
>>> list(csv.reader(['9267,BELMONT,KEELER,,62.4,35.2,10/01/2012,Weekday,"(41.93897000, -87.73212000)"']))[0]
['9267', 'BELMONT', 'KEELER', '', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
>>> list(csv.reader([',,']))[0]
['', '', '']发布于 2020-04-03 10:45:47
所以我最初把另一个答案搞砸了,但结果却是错的。来自文档的引用来自于关于非Posix行为的部分,但默认情况下使用Posix行为。通过Posix行为,您可以得到如下所示的空字符串:
shlex.split('x ""')
# ['x', '']请注意,在Posix模式中,引号不分隔单词,因此会发生这样的情况:
shlex.split('x""')
# ['x']这有点让人费解,但仍然可以使用shlex获得空字符串。
在您的特殊情况下,由于您似乎正在解析类似CSV的输入,所以使用CSV模块是有意义的。
https://stackoverflow.com/questions/35441818
复制相似问题