贪婪模式和非贪婪模式

一、概念



首先举个例子: 

example = "abbbbbbc" 
pattern = re.compile("ab+") 

贪婪模式:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式pattern 匹配字符串example,匹配到的结果就是”abbbbbb”整个字符串

非贪婪模式:在整个表达式匹配成功的前提下,尽可能少的匹配。如上面使用模式pattern 匹配字符串example,匹配到的结果就只是”ab”整个字符串。

 

二、使用方法

在python中默认采用的是贪婪模式,使用非贪婪模式的话,只需要在量词后面直接加上一个问号”?”。 
在第一篇文章中介绍了正则表达式当中的量词一共有五种: 

贪婪模式和非贪婪模式

三、原理分析

 

在正则表达式中一般默认采用的是贪婪模式,在上面的例子当中已经匹配到了“ab”时已经可以使整个表达式匹配成功,但是由于采用的是贪婪模式,所以还需要往后继续匹配,检查时候存在更长的可以匹配成功的字符串。一直到匹配到最后一个”b”的时候,后面已经没有可以成功匹配的字符串了,匹配结束。返回匹配结果“abbbbbb”。 
所以,我们可以将贪婪模式理解为:在整个表达式匹配成功的前提下,尽可能多的匹配。

非贪婪模式也就是将我们例子中的正则表达式“ab+”改为”ab+?”,当匹配到“ab”时,已经匹配成功,直接结束匹配,不在向后继续尝试,返回匹配成功的字符串”ab”。 
所以,我们可以将非贪婪模式理解为:在整个表达式匹配成功的前提下,尽可能少的匹配