我有一些(大部分)按字母顺序处理的文本,例如,以下是每一段的第一个单词:
因此,上面的每一个字代表一个段落的开头,例如:
阿德兰托,加利福尼亚州圣贝纳迪诺县的一座城市,位于维克托维尔西北约9英里(14公里)处,位于大洛杉矶地区内陆帝国的沙漠高地.
每个条目可以有许多段落,这样,不按字母顺序排列的段落就会被视为新条目。
所以每个条目都对应于一个地方。
在示例中,O(ld)在A(lbany)之后,所以Old Albany是一个条目,而N(ew)在O(ld)之前,因此New Albany是Old Albany的延续。
我的问题是:除了在Postgresql中使用Albany的第一个字母和Old Albany/New Albany的第一个字母之外,还有其他的东西吗?例如ASCII ('A') - ASCII ('O')给-14。
那么,我只是在第一个字符上使用ASCII值吗?还是有更普遍的解决方案?
发布于 2015-03-12 08:43:44
目前,我使用的ASCII之间的第一个字母之间的文本,比较了previousRow.description和nextRow.description。
ABS (ASCII (substring ( currentRow.description, 1,1 ) ) -
ASCII ( substring ( previousRow.description, 1 ,1 ) ) https://stackoverflow.com/questions/28997868
复制相似问题