split()的坑
Java中的我们可以利用split把字符串按照指定的分割符进行分割,然后返回字符串数组
split 方法
该方法的作用是:将一个字符串分割为子字符串,然后将结果作为字符串数组返回。
stringObj.split([separator,[limit]])
stringObj
必选项。要被分解的 String 对象或文字,该对象不会被split方法修改。
separator
可选项。字符串或正则表达式对象,它标识了分隔字符串时使用的是一个还是多个字符。如果忽略该选项,返回包含整个字符串的单一元素数组。
limit
参数控制模式应用的次数,因此影响所得数组的长度。如果该限制 n 大于 0,则模式将被最多应用 n - 1 次,数组的长度将不会大于 n,而且数组的最后一项将包含所有超出最后匹配的定界符的输入。如果 n 为非正,那么模式将被应用尽可能多的次数,而且数组可以是任何长度。如果 n 为 0,那么模式将被应用尽可能多的次数,数组可以是任何长度,并且结尾空字符串将被丢弃。
该方法的作用是:将一个字符串分割为子字符串,然后将结果作为字符串数组返回。
stringObj.split([separator,[limit]])
stringObj
必选项。要被分解的 String 对象或文字,该对象不会被split方法修改。
separator
可选项。字符串或正则表达式对象,它标识了分隔字符串时使用的是一个还是多个字符。如果忽略该选项,返回包含整个字符串的单一元素数组。
limit
参数控制模式应用的次数,因此影响所得数组的长度。如果该限制 n 大于 0,则模式将被最多应用 n - 1 次,数组的长度将不会大于 n,而且数组的最后一项将包含所有超出最后匹配的定界符的输入。如果 n 为非正,那么模式将被应用尽可能多的次数,而且数组可以是任何长度。如果 n 为 0,那么模式将被应用尽可能多的次数,数组可以是任何长度,并且结尾空字符串将被丢弃。
遇到的问题是:
- public class Split {
- public static void main(String args[]){
- String s = "1__________";
- String[] arraystr = s.split("_");
- for(int i=0;i<arraystr.length;i++){
- System.out.println("lulu ="+arraystr[i]);
- }
- }
- }
lulu =1
只能解析出第一个元素1,其他的都不能解析但是这样就都能解析出来了
- public class Split {
- public static void main(String args[]){
- String s = "1__________9";
- String[] arraystr = s.split("_");
- for(int i=0;i<arraystr.length;i++){
- System.out.println("lulu ="+arraystr[i]);
- }
- }
- }
lulu =1
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =9
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =9
但是在实际开发的时候不能保证最后一个分隔符被分的字符串为不空,所以在用split()这个方法后再取被分隔的字符串数组的时候有时候就出现数据越界的问题(最后一个分隔符被分的字符串为空)
想到了一个方法是split([separator,[limit]]) ,后面把limit赋值成比该字符串被分隔成字符数组后数组的长度大很多的值,这能保证所有为空的都能被解析,这正应了api里的解释:如果该限制 n 大于 0,则模式将被最多应用 n - 1 次(此时n为15)
- public class Split {
- public static void main(String args[]){
- String s = "1__________";
- String[] arraystr = s.split("_",15);
- for(int i=0;i<arraystr.length;i++){
- System.out.println("lulu ="+arraystr[i]);
- }
- }
- }
lulu =1
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
如果该限制 n 大于 0,则模式将被最多应用 n - 1 次(此时n为5)
- public class Split {
- public static void main(String args[]){
- String s = "1__________";
- String[] arraystr = s.split("_",5);
- for(int i=0;i<arraystr.length;i++){
- System.out.println("lulu ="+arraystr[i]);
- }
- }
- }
lulu =1
lulu =
lulu =
lulu =
lulu =______
lulu =
lulu =
lulu =
lulu =______
如果把limit设置为非正,也能全部解析如:
- public class Split {
- public static void main(String args[]){
- String s = "1__________";
- String[] arraystr = s.split("_",-1);
- for(int i=0;i<arraystr.length;i++){
- System.out.println("lulu ="+arraystr[i]);
- }
- }
- }
结果是:
lulu =1
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
lulu =
1.当参数为整数的时候,只需要截取前几个,需要几个截取几个,这个不用多说。
Java代码
- String line = "aa,bb,cc,dd,,,," ;
- System.out.println(line.split( "," , 6 ).length);
- 输出结果为 6 ,limit参数指定几个,输出几个,最多为 8 个
Java代码
- String line = "aa,bb,cc,dd,,,," ;
- System.out.println(line.split( "," , 0 ).length);
- 输出结果为 4
Java代码
- String line = "aa,bb,cc,dd,,,," ;
- System.out.println(line.split( "," ,- 1 ).length);
- 输出结果为 8
注意:
1、如果用“.”作为分隔的话,必须是如下写法,String.split("\\."),这样才能正确的分隔开,不能用String.split(".");
2、如果用“|”作为分隔的话,必须是如下写法,String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");
2、如果用“|”作为分隔的话,必须是如下写法,String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");
原因解析:
点进去看源码,debug一下,如下图:
可以看到,刚刚开始的时候,确实是有0-7,8个分割出来的东西存在,有三个是空字符串,""。不是null。不用担心空指针异常。
然后 看到下面的继续走,if语句,就看到,他把这个list从尾部开始判断,如果这个list的后面的字符串的长度是0,那么这个resultSize就 减减,然后一直while循环,
直到不符合条件,那么list的下标是5、6、7的值就被抛弃了,然后新生的结果字符串数组,的大小就变成加工过后的长度,那么就变成了长度 5的数组。
list.subList(0, resultSize).toArray(result)
就是这句话啦。
他只是处理后面尾部的空字符串,不处理中间的空字符串和 开头的空字符串。
现在要求字符串
"aa12sas32sasa223sas12as12wqe"//去掉数字,然后弄成数组
"aa,,sas,,sasa,,,,sasas,,,"//去掉逗号,不管几个逗号,都去掉
"aa sas sa sa sas as "//去掉空格,也不管几个,
把他们给分解成数组,同时刨除掉不用的多余信息。
具体实现代码如下:
- private static void testSplitPlus() {
- String ss = "aa12sas32sasa223sas12as12wqe";
- String[] array = ss.split("[\\d]+");
- System.out.println(Arrays.toString(array));
- ss = "aa,,sas,,sasa,,,,sasas,,,";
- array = ss.split("[,]+");
- System.out.println(Arrays.toString(array));
- ss = "aa sas sa sa sas as ";
- array = ss.split("[\\s]+");
- System.out.println(Arrays.toString(array));
- }
- public String[] split(String regex) {
- return split(regex, 0);
- }
那就明白了,这个方法是支持正则表达式操作的。那上面的代码就好解释啦。
第一个[\\d]+这个解释就是\\是转义符,d表示数字,括起来后面的加号表示一个或者多个,那么就可以解释运行结果啦。
第二个[,]解释类似,就是逗号出现一次或多次,
第三个,\\s,就是匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
然后下面,看运行结果。