我有一个包含64位整数列的csv文件,其中一些由于浮点精度问题而被截断。
下面是一个例子
id name
-----------------------------
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028281378205 'GSS Glasgow'
387028000000000 'GSS Glasgow'
387028000000000 'GSS Glasgow'然而,前6位总是正确的,有时余数是零。
对于正确和不正确的ids,第二列总是相同的。
我不能保证正确的id会在不正确的id之前被解析,所以我正在努力思考如何解决这个问题。我真的很感激一些想法。
这里有6000行,有600个不同的“名字”。我可以用python,perl,php来编程,我只需要想出一种防弹的方法。
发布于 2014-04-25 02:53:43
id并修复该组中所有损坏的id。https://stackoverflow.com/questions/23277311
复制相似问题