我有一个100k+行电子表格,其中的副本不是完全重复的。例如,一个单元格将具有以下内容:
ASP.NET.Site.Performance.Secrets..Simple.and.Proven.Techniques.to.Quickly.Speed.up.Your.ASP>.NET.Web.Site
有时,以下单元格(或2或3)将具有相同的确切内容,但其末尾将有一个数字:
ASP.NET.Site.Performance.Secrets..Simple.and.Proven.Techniques.to.Quickly.Speed.up.Your.ASP>.NET.Web.Site.1 ASP.NET.Site.Performance.Secrets..Simple.and.Proven.Techniques.to.Quickly.Speed.up.Your.ASP>.NET.Web.Site.2
我怎样才能有效地消除这些重复?谢谢你能提供的任何帮助。
发布于 2014-02-26 00:02:27
假设数据在A列中,创建一个新的计算列,如下所示:
=IF(ISNUMBER(VALUE(RIGHT(A2,LEN(A2)-FIND("@",SUBSTITUTE(A2,".","@",(LEN(A2)-LEN(SUBSTITUTE(A2,".","")))/LEN(".")))))),LEFT(A2,FIND("@",SUBSTITUTE(A2,".","@",(LEN(A2)-LEN(SUBSTITUTE(A2,".","")))/LEN(".")))-1),A2)太难看了。公式检查最后一个句点后的字符是否为数字。如果是这样的话,它就会剥去它们,然后离开。如果没有,它只返回原始字段。
对于如何获得字符串中的最后一个字符,请归功于Excel: last character/string match in a string。
编辑:基于它始终是一个单一数字,功能可以简化。
=IF(AND(ISNUMBER(VALUE(RIGHT(A1,1))),MID(A1,LEN(A1)-1,1)="."),LEFT(A1,LEN(A1)-2),A1)这将检查最后一个字符是一个数字,第二个最后一个字符是一个“。
https://stackoverflow.com/questions/22028402
复制相似问题