Python 正则表达式(附几种常见的输入限制,如电话号码,Email地址,身份证号等)
简介
-
正则表达式
Regular Expression,简称RE语法
- 普通字符
可打印字符 + 不可打印字符
包括所有大写和小写字母,所有数字,所有标点符号以及一些其他符号 -
非打印字符
字符 | 描述 |
---|---|
\cx | Control+x,x属于[A-Z a-z] |
\f | 换页符 |
\n | 换行符 |
\s | 任何空白字符,包括空格、制表符、换页符等,等价于[\f\n\r\t\v] |
\S | 任何非空白字符 |
\t | 制表符 |
\v | 垂直制表符 |
\r | 回车符 |
- 特殊字符
放到匹配字符的后边,有特殊的含义,要相匹配他们要加反斜杠转义
字符 | 描述 |
---|---|
$ | 输入字符串的结尾位置,特殊的:\n \r |
( ) | 标记一个子表达式的开始和结束位置 |
* | 前面的子表达式零次或多次 |
+ | 前面的子表达式一次或多次 |
. | 除换行符 \n 之外的任何单字符 |
[ ] | 标记一个中括号表达式 |
? | 前面的子表达式零次或一次,非贪婪的,尽可能匹配短的 |
\ | 转义 |
^ | 输入字符串的开始位,特殊的:\n \r |
{ } | 限定符表达式的开始 |
| | 指明两项之间的一个选择 |
- 限定符
指定正则表达式的一个给定组件必须要出现多少次才能满足匹配
字符 | 描述 |
---|---|
* | 前面的子表达式零次或多次 |
+ | 前面的子表达式一次或多次 |
? | 前面的子表达式零次或一次 |
{n} | 匹配确定的 n 次 |
{n,} | 至少匹配n 次 |
{n,m} | 最少匹配 n 次且最多匹配 m 次 |
- 定位符
字符 | 描述 |
---|---|
^ | 输入字符串的开始位,特殊的:\n \r |
$ | 输入字符串的结尾位置,特殊的:\n \r |
\b | 匹配一个单词边界,即字与空格间的位置 |
\B | 非单词边界匹配 |
其他的元字符
字符 | 描述 |
---|---|
(pattern) | 匹配 pattern 并获取这一匹配 |
(?:pattern) | 匹配 pattern 但不获取匹配结果 |
(?=pattern) | 正向肯定预查 |
(?!pattern) | 正向否定预查 |
(?<=pattern) | 反向肯定预查,与正向肯定预查类似,只是方向相反 |
(?<!pattern) | 反向否定预查,与正向否定预查类似,只是方向相反 |
x | y |
[xyz] | 字符集合,匹配所包含的任意一个字符 |
[^xyz | 负值字符集合,匹配未包含的任意字符 |
[a-z] | 字符范围,匹配指定范围内的任意字符 |
[^a-z] | 负值字符范围,匹配任何不在指定范围内的任意字符 |
\d | 匹配一个数字字符,等价于 [0-9] |
\D | 匹配一个非数字字符,等价于 [^0-9] |
\w | 匹配字母、数字、下划线。、,等价于 [A-Za-z0-9_] |
\W | 与\w相反,等价于 [^A-Za-z0-9_] |
\num | 匹配num个,其中 num 是一个正整数,对所获取的匹配的引用。如,'(.)\1' 匹配两个连续的相同字符。 |
运算符优先级
优先级相同的从左到右运算
运算符 | 描述 |
---|---|
\ | 转义符 |
()[] | 括号 |
* , +, ?, {n}, {n,}, {n,m} | 限定符 |
^, $, \任何元字符、任何字符 | 位置和序列 |
| | 或 |
常用表达式
数字
字符
其他
完结!
如有疑问欢迎交流,添加vx: ai_hellohello