HTML5 pattern 详细介绍

1. 正则表达式的应用

 

       在给用户发送消息时通常情况会有相同的消息模板,但其中部分信息跟用户相关,因此需要对消息模板中的变量部分进行替换。而对于一个系统而言可能有很多套完全不同的模板。因此需要一个通用的根据实际信息替换消息模板中变量的方法。消息模板的变量与velcity中的变量规范相同。

 

 
  1. publicstatic <K, V> String replacePlaceHolderWithMapValue(String msg,Map<K,V> placeHolderMap) {

  2. Patternpattern = Pattern.compile("\\$*!?\\{([\\w]+)\\}");

  3. Matchermatcher = pattern.matcher(msg);

  4. Map<String,String> replaceList = new HashMap();

  5. while(matcher.find()) {

  6. StringplaceHolder = matcher.group(0);

  7. Stringkey = matcher.group(1);

  8. Objectvalue = placeHolderMap.get(key);

  9. if(value != null) {

  10. replaceList.put(placeHolder,value.toString());

  11. }

  12. }

  13. for(Entry<String, String> keyValue:replaceList.entrySet()) {

  14. msg= msg.replace(keyValue.getKey(), keyValue.getValue());

  15. }

  16. returnmsg;

  17. }

 

       方法中先获取所有的需要替换的变量存入replaceList中,然后再依次替换。上述方法的正则表达式中,([\\w]+)表示对匹配的内容中进行捕获,捕获值存入matcher.group中,当然也可以有多个捕获。

2. 常用正则表达式

 

[abc]     a、b 或 c(简单类)

[^abc]   任何字符,除了 a、b 或 c(否定)

[a-zA-Z] a到 z 或 A 到 Z,两头的字母包括在内(范围)

[a-d[m-p]]   a到 d 或 m 到 p:[a-dm-p](并集)

[a-z&&[def]]       d、e 或 f(交集)

[a-z&&[^bc]]      a 到 z,除了 b 和 c:[ad-z](减去)

[a-z&&[^m-p]]   a 到 z,而非 m 到 p:[a-lq-z](减去)

.      任何字符(与行结束符可能匹配也可能不匹配)

\d   数字:[0-9]

\D  非数字: [^0-9]

\s   空白字符:[\t\n\x0B\f\r]

\S   非空白字符:[^\s]

\w  单词字符:[a-zA-Z_0-9]

\W 非单词字符:[^\w]

\p{Lower}   小写字母字符:[a-z]

\p{Upper}  大写字母字符:[A-Z]

X?   X,一次或一次也没有

X*   X,零次或多次

X+  X,一次或多次

X{n}      X,恰好 n 次

X{n,}     X,至少 n 次

X{n,m}  X,至少 n 次,但是不超过 m 次

(X) X,作为捕获组

非捕获

(?=X)    X,通过零宽度的正lookahead

(?!X)      X,通过零宽度的负lookahead

(?<=X)  X,通过零宽度的正lookbehind

(?<!X)   X,通过零宽度的负lookbehind

(?>X)    X,作为独立的非捕获组

3 贪婪匹配与懒惰匹配

 

    考虑这个表达式:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。

    a.*?b匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab。

 
  1. public static void main(String[] args) {

  2. String str = "北京市(海淀区)(朝阳区)";

  3. String paternStr = ".*(?=\\()";

  4. Pattern pattern = Pattern.compile(paternStr);

  5. Matcher matcher = pattern.matcher(str);

  6. if (matcher.find()) {

  7. System.out.println(matcher.group(0));

  8. }

  9. }

上述方法的输出为:北京市(海淀区)

 
  1. public static void main(String[] args) {

  2. String str = "北京市(海淀区)(朝阳区)";

  3. String paternStr = ".*?(?=\\()";

  4. Pattern pattern = Pattern.compile(paternStr);

  5. Matcher matcher = pattern.matcher(str);

  6. if (matcher.find()) {

  7. System.out.println(matcher.group(0));

  8. }

  9. }

上述方法输出:北京市

一些有用的HTML5 pattern属性

最近在做手机页面时,遇到数字输入的键盘的问题,之前的做法只是一刀切的使用 type="tel",不过一直觉得九宫格的电话号码键盘上的英文字母太碍事了。于是想要尝试其它的实现方案,最终的结论却令人沮丧。不过也趁机详细了解了下pattern这个属性。

type="tel" 和 type="number" 的区别

这里还是先那么先交代一下最初遇到的问题。其实无论是tel还是number都不是完美的:

type="tel"

  • 优点是iOS和Android的键盘表现都差不多

  • 缺点是那些字母好多余,虽然我没有强迫症但还是感觉怪怪的啊。 

HTML5 pattern 详细介绍

type="number"

  • 优点是Android下实现的一个真正的数字键盘

  • 缺点一:iOS下不是九宫格键盘,输入不方便

  • 缺点二:旧版Android(包括微信所用的X5内核)在输入框后面会有超级鸡肋的小尾巴,好在Android 4.4.4以后给去掉了。

HTML5 pattern 详细介绍

HTML5 pattern 详细介绍

不过对于缺点二,我们可以用webkit私有的伪元素给fix掉:

1

2

3

4

5

6

input[type=number]::-webkit-inner-spin-button,  

    input[type=number]::-webkit-outer-spin-button { 

        -webkit-appearance: none; 

        appearance: none; 

        margin: 0; 

    }

pattern属性

pattern用于验证表单输入的内容,通常HTML5的type属性,比如email、tel、number、data类、url等,已经自带了简单的数据格式验证功能了,加上pattern后,前端部分的验证更加简单高效了。

显而易见,pattern的属性值要用正则表达式。

实例

简单的数字验证

数字的验证有两个:

1

2

<input type="number" pattern="\d">  

<input type="number" pattern="[0-9]*"></input type="number" pattern="[0-9]*"></input type="number" pattern="\d">

 

HTML5 pattern 详细介绍

对表单验证来说,这两个正则的作用是一样的,表现的话差异就很大:

  • iOS中,只有[0-9]\*才可以调起九宫格数字键盘,\d 无效

  • Android 4.4以下(包括X5内核),两者都调起数字键盘;

  • Android 4.4.4以上,只认 type 属性,也就是说,如果上面的代码将 type="number" 改为 type="text" ,将调起全键盘而不会是九宫格数字键盘。

常用的正则表达式

pattern的用法都一样,这里不再啰嗦各种详细写法了,只是列出来一些常用的正则就好了:

  • 信用卡  [0-9]{13,16}

  • 银联卡  ^62[0-5]\d{13,16}$

  • Visa: ^4[0-9]{12}(?:[0-9]{3})?$

  • 万事达:^5[1-5][0-9]{14}$

  • QQ号码: [1-9][0-9]{4,14}

  • 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$

  • 身份证:^([0-9]){7,18}(x|X)?$

  • 密码:^[a-zA-Z]\w{5,17}$ 字母开头,长度在6~18之间,只能包含字母、数字和下划线

  • 强密码:^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$ 包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间

  • 7个汉字或14个字符:^[\u4e00-\u9fa5]{1,7}$|^[\dA-Za-z_]{1,14}$

浏览器支持

很不幸,pattern的浏览器支持很惨:

HTML5 pattern 详细介绍