python正则表达式模块re

参考以及截图来自python官方文档的中文版本,在此感谢译者
http://python.usyiyi.cn/translate/python_352/howto/regex.html#regex-howto

对文档的一些笔记:

  • r
    python正则表达式模块re
    这里用字符前面加‘r’前缀来表示原始字符串(不存在转义)。原因是,首先我们把正则表达式和python对象看成两个不同的东西,正则表达式有些字符需要转义,如‘\’,需要写成‘\\’才表示‘\’,但与python的表示冲突,因为你写成‘\\’,python也会理解成‘\’,但我们必须让python解析成‘\\’才能正确表达正则表达式。这样我们就需要在正则表达式转化为python对象时,写成‘\\\\’来表示‘\\’。这就显得很繁琐,于是我们可以直接用r‘\\’,来表示‘\\’。前面加了r的字符串就解析成他本来的样子。

  • 贪婪模式和懒惰模式
    python正则表达式模块re
    正则表达式的贪婪模式是尽可能匹配多的字符,懒惰模式是尽可能匹配少的字符,在模式最后加上’?’即可进入贪婪模式