草庐IT

haaaaapppppyyy

全部标签

python - 从单词中删除重复字符

我想知道将“haaaaapppppyyy”之类的内容转换为“haappyy”的最佳方法是什么。基本上,在解析俚语时,人们有时会重复字符以增加强调。我想知道最好的方法是什么?使用set()不起作用,因为字母的顺序显然很重要。有什么想法吗?我正在使用Python+nltk。 最佳答案 可以使用正则表达式来完成:>>>importre>>>re.sub(r'(.)\1+',r'\1\1',"haaaaapppppyyy")'haappyy'(.)\1+替换任何字符(.)后跟一个或多个相同的字符(因为backref\1必须相同)乘以字符的两