python3 re模块
一、常用正则表达式符号和语法二、常用函数
1、re.match(pattern,string,flags=0):从字符串起始位置开始匹配,如果匹配不成功则返回none ;pattern指匹配的正则表达式,string表示要匹配的字符串,flags控制正则表达式的匹配方式,如“区分大小写,换行等”
2、re.search(pattern,string,flags=0):扫描整个字符串,并返回第一个成功的匹配
3、re.findall(pattern,string,flags=0):找到re匹配的所有字符串,并把他们作为一个列表返回
4、re.finditer(pattern,string,flags=0):找到re匹配的所有字符串,并把他们作为一个迭代器返回
5、re.sub(pattern,repl,string,count=0,flags=0):替换匹配到的字符串;repl要替换的字符串count替换最大次数0为全部
6、获取匹配的函数:
- group(num=0):返回整个表达式或对应组,如果输入多个组则返回包含相应值得元组,若对应组不存在报错
- groups():返回包含所有组的元组
- groupdict():返回以有别名的组的别名为键、以该组截获的子串为值的字典
- start():返回匹配开始的位置
- end():返回匹配结束的位置
- span():返回一个元组包含匹配(开始,结束)的位置
三、贪婪模式与非贪婪模式
贪婪模式指总是尝试匹配尽可能多的字符;非贪婪则相反,总是尝试匹配尽可能少的字符。在"*","?","+","{m,n}"后面加上?,使贪婪变成非贪婪。