素材牛VIP会员
正则表达式如何匹配重复出现的字符串
 大***咒  分类:Python  人气:6568  回帖:5  发布于6年前 收藏

比如说aaabccc11fdsa这个字符串,我要把aaa,ccc和11这种会重复两次以上的字符串匹配出来,该怎么办?如果正则表达式做不到的话,有其他什么PHP,Python内置函数可以做到吗?内置函数也没有的话只能手写算法了吗?

讨论这个帖子(5)垃圾回帖将一律封号处理……

Lv1 新人
BO***OS 职业无 6年前#1

JS代码:

var s = 'aaabccc11fdsa';
var re = /(.)\1+/g;

console.log(s.match(re));

其中,正则表达式中.表示任意字符,\1表示第一个被匹配到的分组,+表示匹配前一个字符一次或一次以上。

Lv5 码农
me***20 技术总监 6年前#2
<?php
preg_match_all(
    '/(\w)\1+/i',
    'aaabccc11fdsa',
    $matches,
    PREG_PATTERN_ORDER
);
print_r($matches[0]);
Lv3 码奴
陈***半 页面重构设计 6年前#3

用个简单的正则就可以匹配了,我只会js的。

var s = 'aaabccc11fdsa';
var reg = /(\w)\1+/ig;

console.log(s.match(reg)); //["aaa", "ccc", "11"]
Lv5 码农
sn***12 PHP开发工程师 6年前#4

Python代码:

(\w)匹配字母数字下划线即[a-zA-Z0-9_]
((\w)\2)匹配重复的字符,其中\2匹配分组number是2的分组,因为最外层有圆括号,所以number是2的分组就是前面\w匹配的字符
((\w)\2+)匹配重复出现2次或以上的字符

>>> import re
>>> str = 'aaabccc11fdsa'
>>> re.findall(r'((\w)\2+)', str)
[('aaa', 'a'), ('ccc', 'c'), ('11', '1')]
>>> [match[0] for match in re.findall(r'((\w)\2+)', str)]
['aaa', 'ccc', '11']
>>> 

参考链接:Python字符串操作相关问题

Lv2 入门
yz***zw 学生 6年前#5
import re
a = 'aaabccc11fdsa'
b = re.finditer(r'(.)(\1+)', a)
for i in b:
    print(i.group())

这样应该可以

 文明上网,理性发言!   😉 阿里云幸运券,戳我领取