素材牛VIP会员
Python 正则表达式替换字符
 13***62  分类:Python  人气:1509  回帖:5  发布于6年前 收藏
python a="32<2>fdssa</2>ffdsa32"
 re.sub(r'<(\d+)>|</(\d+)>',"item",a)
result:'32itemfdssaitemffdsa32'

如何正确替换得到结果:
a="32<item>fdssa</item>ffdsa32"

讨论这个帖子(5)垃圾回帖将一律封号处理……

Lv5 码农
38***38 职业无 6年前#1

re.sub(r'((?<=<)|(?<=</))\d+','item',a)

或者

re.sub(r'((?<=<)|(?<=</))\w+','item',a)

Lv6 码匠
12***23 页面重构设计 6年前#2

由于look-behind requires fixed-width pattern,就是这个(?<=<|\/)无法写成(?<=<|<\/)这个形式。
所以,下面的只能凑合着用

re.sub(r'(?<=<|/)\d+(?=>)',"item",a)

下面的答案给了我提示:

re.sub(r'(<\s*\/?\s*)\d+(\s*>)', r'\1item\2', a)

Lv2 入门
麦***气 JAVA开发工程师 6年前#3

这样?

>> re.sub(r'<\d+>([^<]+)</\d+>', r'<item>\1</item>', '32<2>fdssa</2>ffdsa32')
'32<item>fdssa</item>ffdsa32'
Lv6 码匠
lu***ng 软件测试工程师 6年前#4
import re
a="32<2>fdssa</2>ffdsa32"
re.sub(r'<\d+?>(.+?)</\d+?>', r'<item>\1</item>', a)
Lv6 码匠
de***22 移动开发工程师 6年前#5

美女,给你两个解法

第一个是用non-greedy match:

In [1]: re.sub(r'<(/?)\d+>+?',"<\g<1>item>","32<2>fdssa</2>ffdsa32")
Out[1]: '32<item>fdssa</item>ffdsa32'

另外一个是传个函数进去:

def repl(match):
    if match.group(1):
        return "<item>"
    elif match.group(2):
        return "</item>"
    else:
        return ""

re.sub(r'(<\d+>)+?|(</\d+>)+?',repl,"32<2>fdssa</2>ffdsa32")
==>'32<item>fdssa</item>ffdsa32'
 文明上网,理性发言!   😉 阿里云幸运券,戳我领取