Python基础15——python模块之re与正则
15.1 正则表达式相关字符及其含义和使用
re提供了正则表达式匹配操作,下面来说下正则相关内容
正则:正则表达式是计算机科学的一个概念,正则表通常被用来检索、替换那些符合某个模式(规则)的文本。也就是说使用正则表达式可以再字符串中匹配出你需要的字符或者字符串,甚至可以替换你不需要的字符或者字符串。
其实很简单,正则表达式就是进行字符匹配,那么对于正则表达式而言有两种字符,一种是元字符,一种是普通字符,其实元字符表示具有特殊功能特殊意义的字符,正则表达式往往就是元字符和普通字符的组合,但是正则表达式之所以功能强大主要依靠的是元字符
正则表达式的元字符有:. ^ $ * + ? {} [] \ | ()
其中注意^ 在[]外表示查找从字符串开头进行,在[^]内表示非
15.2 相关几个函数:
1、match():首字母开始匹配匹配,开头能匹配到就是成功,开头匹配不到就是失败。成功返回match对象,失败返回None
2、search()只要找到匹配的就返回match对象,如果有多个匹配结果就只返回第一个
3、findall()匹配并且返回全部匹配到的对象
4、compile()把正则表达式编辑成正则对象,当一个正则需要使用多次的时候,为了避免重复书写多次,所以把它编程正则对象,后面直接用这个对象就可以了。
5、sub(old,new,str,count) 替换,默认全部替换,可以设置替换次数
图片中还展示了re的split函数的分割,re中的split函数与字符串的split函数唯一优势在于,re的split切割的标准可以是一个正则表达式。
6、group()、start()、end()、span()