首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从字符串中剥离标点符号,然后将其添加回相同的索引?

如何从字符串中剥离标点符号,然后将其添加回相同的索引?
EN

Stack Overflow用户
提问于 2013-03-12 06:12:02
回答 2查看 1.8K关注 0票数 1

我想让程序假设我的word_str是“例如,这是‘剑桥大学’”。它将保留单词的第一个和最后一个字母,如果单词的长度超过3个字符长度,则会在单词内部乱爬。我的问题是,它在单词的开头或结尾错误地打乱了标点符号。我需要它洗牌,以便标点符号保持在正确的索引中,然后保留单词的第一个和最后一个字母,并将单词的内部打乱,如果有的话,在结尾添加标点符号。有什么想法吗?

代码语言:javascript
复制
def scramble_word(word_str):
char = ".,!?';:"
import random
if len(word_str) <= 3:
    return word_str + ' '
else:
    word_str = word_str.strip(char)
    word_str = list(word_str)
    scramble = word_str[1:-1]
    random.shuffle(scramble)
    scramble = ''.join(scramble)
    word_str = ''.join(word_str)
    new_word = word_str[0] + scramble + word_str[-1]
    return new_word + ' '
EN

回答 2

Stack Overflow用户

发布于 2013-03-12 06:27:56

使用正则表达式:

代码语言:javascript
复制
import random
import re

random.seed(1234) #remove this in production, just for replication of my results

def shuffle_word(m):
    word = m.group()
    inner = ''.join(random.sample(word[1:-1], len(word) - 2))
    return '%s%s%s' % (word[0], inner, word[-1])
    
s = """This is 'Cambridge University' for example."""

print re.sub(r'\b\w{3}\w+\b', shuffle_word, s)

哪种打印

代码语言:javascript
复制
Tihs is 'Cadibrgme Uinrtvsiey' for exlampe.

re.sub允许您向它传递一个函数(接受一个正则表达式匹配对象),而不是一个替换字符串。

编辑-不使用正则表达式

代码语言:javascript
复制
from StringIO import StringIO

def shuffle_word(m):
    inner = ''.join(random.sample(m[1:-1], len(m) - 2))
    return '%s%s%s' % (m[0], inner, m[-1])

def scramble(text)
    sio = StringIO(text)
    accum = []
    start = None
    while sio.tell() < sio.len:
        char = sio.read(1)
        if start is None:
            if char.isalnum():
                start = sio.tell() - 1
            else:
                accum.append(char)
        elif not char.isalnum():
            end = sio.tell() - 1
            sio.seek(start)
            accum.append(shuffle_word(sio.read(end - start)))
            print accum[-1]
            start = None
    else:
        if start is not None:
            sio.seek(start)
            word = sio.read()
            if len(word) > 3:
                accum.append(shuffle_word(sio.read()))
            else:
                accum.append(word)
    
    return ''.join(accum)

s = """This is 'Cambridge University' for example."""
print scramble(s)
票数 6
EN

Stack Overflow用户

发布于 2013-03-12 06:41:02

使用正则表达式非常简单:

代码语言:javascript
复制
import re
import random

s = ('Pitcairn Islands, Saint Helena, '
     'Ascension and Tristan da Cunha, '
     'Saint Kitts and Nevis, '
     'Saint Vincent and the Grenadines, Singapore')

reg = re.compile('(?<=[a-zA-Z])[a-zA-Z]{2,}(?=[a-zA-Z])')

def ripl(m):
    g = list(m.group())
    random.shuffle(g)
    return ''.join(g)

print reg.sub(ripl,s)

结果

代码语言:javascript
复制
Piictran Islands, Sanit Heelna, Asnioecsn and Tiastrn da Cunha, Sniat Ktits and Neivs, Snait Vnnceit and the Giearndens, Snoiaprge
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15349709

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档