我制作了一个web应用程序来上传tsv文件。
被解析为“t”、“n”、“r”的TSV文件
验证就是。
1.文件名是否遵循命名约定?
2.是TSV文件吗?
如何对类似TSV的图片或Office文档进行验证?
发布于 2009-07-23 05:44:45
这取决于您对TSV文件的定义。
他们都有相同数量的专栏吗?或者可以省略最后的空列吗?
如果它们都有相同数量的列,那么您可以对其进行第一次验证。如果它失败了,那么您就知道该文件无效。
他们都有标题行吗?如果是这样的话,您可以使用它来回答上面的问题并验证文件解析。
允许引用吗?如果允许,是否允许在引号上放置回车或标签?(不一定有助于验证,但解析时必须考虑到这一点)
你的文字严格意义上是文字吗?您可以测试不可打印的字符,并在此基础上拒绝它。同样,在文件中使用的字符编码(UTF与ASCII等)上要小心。这可以放在执行从平面文件到数据结构的第一次解析的代码中(例如,映射列表)。
进一步钻研文件本身,如果它是固定格式或某些数据的类型是已知的,您可以制作一个辅助解析器来验证这些数据(日期、时间戳或其他固定格式字符串)。当您发现了更多关于内容的内容并正在处理上述结构中的数据时,就可以完成第二个级别。
以上都是经验性的分析,所以你必须期待假阳性下降,尽管如果你选择你的输入文件必须遵守的规则,那么错误的否定就不会发生。因此,整个处理堆栈都希望遇到无效的数据,并准备使整个文件输入失效,换句话说,不要假设所做的测试完全保证了文件的正确性。
我希望这能帮到你。
https://stackoverflow.com/questions/1169686
复制相似问题