`

第001号---一句字符串中分离单词

    博客分类:
  • JAVA
阅读更多

今天写程序的时候遇到一个问题,就是如果把一句话中的单词从这句话中分离出来

比如:Always bear in mind that your own resolution to success is more import than anything!

那么就把每个单词都分离开显示,以便进一步对分离的单词进行操作

 

实现起来很简单,即用到split方法和正则表达式的结合即可

import java.util.Scanner;
public class Test01 {
	public static void main(String args[])
	{
		Scanner input=new Scanner(System.in); 
		String str = input.nextLine();
		
		String[] arr=str.split("[^a-zA-Z0-9]+");
		for(int i=0;i<arr.length;i++)
		      System.out.println(arr[i]);
		System.out.println("There are "+arr.length+" words in the line!");
	}
}

 

 

 

这样,就将里面的单词,分离出来了,如果有数字的话,也可以分离开来

 

下面就说说split方法的使用

 

一、split方法

java.lang.string.split

功能:将一个字符串分割成子字符串,然后将结果作为字符串数组返回

用法:stringObject.split([separator,[limit]])

split方法的结果是一个字符串数组,在stringObject中每个出现separator的位置都要进行分解

 

stringObject为必选项,就是要被分解的String对象或者文字,该对象不会被split方法修改

separator为可选项。字符串或者正则表达式对象,它标示了分离字符串时使用的是一个还是多个字符,如果忽略该选项

返回包含整个字符串的单一元素的数组。

limit可选项:这个值用来限制返回数组中元素个数

 

例子1:

public class Test01 {
	public static void main(String args[])
	{
		String str = "what is your name";
		String s[] = str.split(" ");
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

 

运行结果:

what
is
your
name

 

例子2:

public class Test01 {
	public static void main(String args[])
	{
		String str = "what is your name";
		String s[] = str.split(" ",3);
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

 运行结果:

what
is
your name

 

例子3:

public class Test01 {
	public static void main(String args[])
	{
		String str = "192.168.10.1";
		String s[] = str.split("\\.");
		for(int i = 0; i < s.length; i++)
		{
			System.out.println(s[i]);
		}
		
	}
}

 

运行结果:

192
168
10
1

 

这里会看到,split方法里多了两个斜杠,如果去掉斜杠后,运行,会发现,没有任何结果,其实split(String regex)方法中的regex是一个正则表达式,而.在正则表达式中有其他的意思,所以需要进行转义才可以用

 

 下面的是从网上找到的

[size=12px]1^\d+$  //匹配非负整数(正整数 + 0)
2^[0-9]*[1-9][0-9]*$  //匹配正整数
3^((-\d+)|(0+))$  //匹配非正整数(负整数 + 0)
4^-[0-9]*[1-9][0-9]*$  //匹配负整数
5^-?\d+$    //匹配整数
6^\d+(\.\d+)?$  //匹配非负浮点数(正浮点数 + 0)
7^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$  //匹配正浮点数
8^((-\d+(\.\d+)?)|(0+(\.0+)?))$  //匹配非正浮点数(负浮点数 + 0)
9^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$  //匹配负浮点数
10^(-?\d+)(\.\d+)?$  //匹配浮点数
11^[A-Za-z]+$  //匹配由26个英文字母组成的字符串
12^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串
13^[a-z]+$  //匹配由26个英文字母的小写组成的字符串
14^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串
15^\w+$  //匹配由数字、26个英文字母或者下划线组成的字符串
16^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$    //匹配email地址
17^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$  //匹配url
18。匹配中文字符的正则表达式: [\u4e00-\u9fa5]
19。匹配双字节字符(包括汉字在内):[^\x00-\xff]
20。应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len
=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
21。匹配空行的正则表达式:\n[\s| ]*\r
22。匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
23。匹配首尾空格的正则表达式:(^\s*)|(\s*$)

* 正则表达式用例
 
* 1^\S+[a-z A-Z]$ 不能为空 不能有空格  只能是英文字母
 
* 2、\S{6,}         不能为空 六位以上
 
* 3^\d+$          不能有空格 不能非数字
 
* 4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式
 
* 5^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式
 
* 6^0$            至少选一项
 
* 7^0{2,}$        至少选两项
 
* 8^[\s|\S]{20,}$ 不能为空 二十字以上
 
* 9^\+?[a-z0-9](([-+.]|[_]+)?[a-z0-9]+)*@([a-z0-9]+(\.|\-))+[a-z]{2,6}$邮件
 
* 10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 输入多个地址用逗号或空格分隔邮件
 
* 11^(\([0-9]+\))?[0-9]{7,8}$电话号码7位或8位或前面有区号例如(02287341628
 
* 12^[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+(\,[a-z A-Z 0-9 _]+@[a-z A-Z 0-9 _]+(\.[a-z A-Z 0-9 _]+)+)*$
 
*     只能是字母、数字、下划线;必须有@和.同时格式要规范 邮件
 
* 13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表达式也可以写成这样子,更精练。
   
14   ^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$ [/size]

  • 大小: 8.5 KB
分享到:
评论
1 楼 Hmily49 2011-05-28  
看了,获益匪浅。

相关推荐

Global site tag (gtag.js) - Google Analytics