`
234390216
  • 浏览: 10194096 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
博客专栏
A5ee55b9-a463-3d09-9c78-0c0cf33198cd
Oracle基础
浏览量:460821
Ad26f909-6440-35a9-b4e9-9aea825bd38e
springMVC介绍
浏览量:1771877
Ce363057-ae4d-3ee1-bb46-e7b51a722a4b
Mybatis简介
浏览量:1395481
Bdeb91ad-cf8a-3fe9-942a-3710073b4000
Spring整合JMS
浏览量:393917
5cbbde67-7cd5-313c-95c2-4185389601e7
Ehcache简介
浏览量:678253
Cc1c0708-ccc2-3d20-ba47-d40e04440682
Cas简介
浏览量:529320
51592fc3-854c-34f4-9eff-cb82d993ab3a
Spring Securi...
浏览量:1178774
23e1c30e-ef8c-3702-aa3c-e83277ffca91
Spring基础知识
浏览量:462010
4af1c81c-eb9d-365f-b759-07685a32156e
Spring Aop介绍
浏览量:150169
2f926891-9e7a-3ce2-a074-3acb2aaf2584
JAXB简介
浏览量:66890
社区版块
存档分类
最新评论

字符串分割,你会吗?

    博客分类:
  • java
阅读更多

 

      对于字符串的分割主要有两种方式,使用Stringsplit方法和使用StringTokenizer。现在假设我们有一个字符串“||a|b||c|d|||”,然后我们需要使用“|”来对它进行分割。那么如下两段代码你觉得输出结果会是什么呢?

    public static void main(String args[]) {
        String str = "||a|b||c|d|||";
        String strArray[] = str.split("\\|");
        System.out.println(strArray.length);
        for (int i=0; i<strArray.length; i++) {
            System.out.println("strArray["+i+"] = " + strArray[i]);
        }
    }
 
    public static void main(String args[]) {
        String str = "||a|b||c|d|||";
        StringTokenizer tokenizer = new StringTokenizer(str, "|");
        int len = tokenizer.countTokens();
        System.out.println(len);
        while (tokenizer.hasMoreTokens()) {
            System.out.println(tokenizer.nextToken());
        }
    }

 

 

 

      正确答案是第一段代码会输出如下:

7
strArray[0] = 
strArray[1] = 
strArray[2] = a
strArray[3] = b
strArray[4] = 
strArray[5] = c
strArray[6] = d

 

 

 

      第二段代码输出如下:

4
a
b
c
d

 

       下面这段代码呢?

    public static void main(String args[]) {
        String str = "|||abcd||eacd|||";
        StringTokenizer tokenizer = new StringTokenizer(str, "|ab");
        int len = tokenizer.countTokens();
        System.out.println(len);
        while (tokenizer.hasMoreTokens()) {
            System.out.println(tokenizer.nextToken());
        }
    }

       输出如下:

3
cd
e
cd

 

      你答对了吗?接下来我们来解释一下为什么是上面的输出结果。

      Stringsplit方法分割

Stringsplit方法接收的参数是一个正则表达式,其底层调用的是正则表达式的split方法。Stringsplit方法源码是这样的:

 

    public String[] split(String regex, int limit) {
            return Pattern.compile(regex).split(this, limit);
    }

 

 

 

 

 

      而正则表达式Patternsplit方法是这样实现的:

    public String[] split(CharSequence input, int limit) {
        int index = 0;
        boolean matchLimited = limit > 0;
        ArrayList<String> matchList = new ArrayList<String>();
        Matcher m = matcher(input);
 
        // Add segments before each match found
        while(m.find()) {
            if (!matchLimited || matchList.size() < limit - 1) {
                String match = input.subSequence(index, m.start()).toString();
                matchList.add(match);
                index = m.end();
            } else if (matchList.size() == limit - 1) { // last one
                String match = input.subSequence(index,
                                                 input.length()).toString();
                matchList.add(match);
                index = m.end();
            }
        }
 
        // If no match was found, return this
        if (index == 0)
            return new String[] {input.toString()};
 
        // Add remaining segment
        if (!matchLimited || matchList.size() < limit)
            matchList.add(input.subSequence(index, input.length()).toString());
 
        // Construct result
        int resultSize = matchList.size();
        if (limit == 0)
            while (resultSize > 0 && matchList.get(resultSize-1).equals(""))
                resultSize--;
        String[] result = new String[resultSize];
        return matchList.subList(0, resultSize).toArray(result);
    }

 

 

 

      当分割的字符串中含有分隔符时,注意这段代码:

        int resultSize = matchList.size();
        if (limit == 0)
            while (resultSize > 0 && matchList.get(resultSize-1).equals(""))
                resultSize--;
        String[] result = new String[resultSize];
        return matchList.subList(0, resultSize).toArray(result);    

 

在没有限制分割数量的情况下,Pattern会把最末端为空串的元素都丢弃。所以当我们使用split方法以“|”为分隔符分割字符串||a|b||c|d|||”时将会把最后三个空元素丢弃,也就出现了上面的结果。

StringTokenizer分割

       StringTokenizer会把传递的分隔符拆分成一个个的字符,也就是char,然后会把每一个char都当成是一个分隔符。在进行字符串分割时会判断字符串的每一个字符是否在分隔符中,如果在则跳过这个字符,直到遇见不是分隔符的字符,然后把连续不是分隔符的字符组成一个串,如此往复。所以当我们使用“|”分割字符串"||a|b||c|d|||"时,StringTokenizer遇见分隔符“|”就跳过了,就会出现上述的结果。StringTokenizer的源码太多了我这里就不贴了,有兴趣的朋友可以自己去看。同样的道理,当我们使用“ab|”分割字符串“|||abcd||eacdf|||”时会把它分割成3个字符串,分别是“cd”、“e”、“cdf”。

 

2
0
分享到:
评论
2 楼 faradayroger 2017-01-10  
1 楼 Thomsonxu 2014-11-14  
好文章,学习了

相关推荐

    rf.rar_RF 字符串截取_Rf字符串比较_rf字符串切割

    一个关于字符串匹配的算法,已经经过编译,希望对你有帮助

    PHP 字符串分割和比较

    我的思路是单字符串分割为一个个字母(character),这样比较就能精确知道在那个位置不同了。 分隔字符串,使用“str_split”就可以了,语法参考【2】。然后输出结果数组,好处是连空格也会作为数组的元素。我之前的...

    vc++字符串拆分

    这个一个用vc++实现的字符串分割类库,很实用

    delphi之分割字符串

    运用delphi教你如何实现分割字符串,让分割字符串不再是烦恼

    Python中用于将字符串分割成子字符串的split()函数

    python中split函数的用法 split()函数通常用于处理文本数据,从CSV文件中提取数据,或者从用户输入的命令行参数中提取信息...根据不同的情况,你可以使用不同的分隔符来拆分字符串,并使用maxsplit来限制拆分的次数。

    JS截取与分割字符串常用技巧总结

    主要介绍了JS截取与分割字符串常用技巧,以实例形式分析你了JavaScript针对字符串的截取与分割常用函数的定义、功能及使用技巧,并补充分析了substr和substring方法的区别,需要的朋友可以参考下

    易语言-分割一串连续文本成数组例子

    分割一串连续文本成数组

    高效中英文字符串截取方法

    即使是10W条记录也能在1S没迅速完成你所得结果,中英混合的 如果想学习的朋友请关注下 欢迎大家下载

    python 回文子串,给你一个字符串a和一个正整数n,判断a中是否存在长度为n的回文子串。

    # 给你一个字符串a和一个正整数n,判断a中是否存在长度为n的回文子串。 # 如果存在,则输出YES,否则输出NO。 # 回文串的定义:记串str逆序之后的字符串是str1,若str=str1,则称str是回文串,如"abcba". # 输入...

    正则表达式

    就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现。使用这个小型语言,你可以为想要...你也可以使用 RE 以各种方式来修改或分割字符串。

    python中split函数的用法.pdf

    split 函数在 Python 中是一个用于字符串分割的内置方法。它的主要作用是根据指定的分隔符将字符串分割成一个列表,列表中的每个元素都是原字符串中被分隔符分割开来的子字符串。 概述 split 函数通常被用于处理...

    LeetCode 1221. 分割平衡字符串

    给出一个平衡字符串 s,请你将它分割成尽可能多的平衡字符串。 返回可以通过分割得到的平衡字符串的最大数量。 示例 1: 输入:s = RLRRLLRLRL 输出:4 解释:s 可以分割为 RL, RRLL, RL, RL, 每个子字符串中都包含...

    Python实现像awk一样分割字符串

    若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。 [root@localhost ~]# cat demo.txt hello world [root@localhost ~]# [root@localhost ~]# awk ...

    Java8 将List<Integer> 转换成以逗号分割的String字符串

    Java8 将List<Integer> 转换成以逗号分割的String字符串。 一篇文章带你快速了解!

    Python程序设计:正则表达式检索与替换.pptx

    邮箱验证 任务 邮箱验证 任务背景 本任务是利用正则表达式对邮箱进行校验。...正则表达式是一个特殊的字符序列,它能方便的检查一个字符串...search()函数会在整个字符串内查找模式匹配,直到找到第一个匹配然后返回一个包

    中文正则表达式简单易懂

    你也可以使用 RE 以各种方式来修改或分割字符串。 正则表达式模式被编译成一系列的字节码,然后由用 C 编写的匹配引擎执行。在高级用法中,也许还要仔细留意引擎是如何执行给定 RE ,如何以特定方式编写 RE 以令...

    最常见和最有用的字符串相关的方法详解

    转换字符串 ...将字符串分割成多个子字符串 为了区分一个字符串转换为一个子字符串数组,你可以使用的split()方法: var myString = "coming,apart,at,the,commas"; var substringArray = myString.s

    模仿古文竖排工具,你可以设置每一页的高度、列数、字体、分割字符串以及每页间距 ,整体上下左右移动。

    你可以设置每一页的高度、列数、字体、分割字符串以及每页间距 ,整体上下左右移动。 使用说明:每当你在上面文本框输入一个字符,它将从右到左竖着输入在下面的文本框中!

    VC++ 任意拆分字符串,用逗号隔开

    内容索引:VC/C++源码,字符处理,字符串 VC++ 以逗号为分隔点,自由任意拆分字符串,经常编写代码的朋友可能会想到Split,对,本代码就是使用Split函数实现分隔字符串,这相当实用,在日常编程中,对字符串的截娶过滤...

Global site tag (gtag.js) - Google Analytics